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第 4 版 前 言 


计算 机 技术 的 飞速 发 展 超过 了 人 们 的 想象 。 操 作 系 统 作 为 一 门 计算 机 的 基础 课程 ,无 
论 是 对 计算 机 等 信息 技术 专业 的 学 生 或 研究 人 员 ,还 是 对 一 般 计 算 机 应 用 人 员 而 言 ,都 是 非 
常 有 益 和 重要 的 。 

本 书 自 1993 年 出 版 以 来 ,得 到 了 广大 读者 的 支持 和 厚爱 。 特 别 是 1999 年 第 2 版 之 后 ， 
本 书 更 得 到 了 许多 学 校 的 老师 和 学 生 们 的 支持 。 这 令 编著 者 非常 感动 。 在 前 3 版 的 基础 
上 ,结合 散人 式 系统 技术 及 操作 系统 技术 的 发 展 ,我 们 对 本 书 内 容 进 行 了 新 的 补充 。 

本 书 的 改编 考虑 了 如 下 几 个 事实 : 

首先 ,这 是 一 本 讲授 操作 系统 基本 原理 的 本 科 生 教材 ,因此 讲授 内 容 不 宜 过 深 过 细 ， 而 
重 在 强调 “为 什么 "“ 是 什么 ”和 “怎样 做 ”。 因 此 ,本 书 未 在 基本 概念 及 基本 原理 方面 进行 
变动 。 

其 次 ,考虑 到 Linux 2.6 和 Windows NT 6.0 内 核 版 本 是 目前 正在 使 用 的 主流 操作 系 
统 内 核 版 本 ,本 书 的 操作 系统 实例 在 第 3 版 中 的 Linux 2.4 和 Windows NT 的 基础 上 ,适当 
补充 了 Linux 2.6 和 Windows NT 6.0 内 核 版 本 的 一 些 内 容 。 

第 三 ,考虑 到 散 入 式 系 统 的 发 展 ,本 书 在 最 后 增加 了 骨 入 式 操 作 系 统 的 管理 机 制 \ 租 入 
式 操作 系统 的 集成 开发 环境 及 开发 过 程 的 内 容 , 并 对 实验 和 习题 进行 了 改写 。 

本 书 共 12 章 。 第 1 章 简要 介绍 操作 系统 的 基本 概念 、 功 能 、 分 类 以 及 发 展 历史 等 。 第 
2 章 主 要 讨论 操作 系统 的 两 种 界面 和 简单 的 使 用 操作 方法 。 第 3 章 介 绍 进程 与 线程 管理 的 
有 关 概 念 和 技术 。 第 4 章 主要 介绍 处 理 机 管理 和 调度 策略 。 调 度 策 略 与 算法 主要 用 于 处 理 
机 管理 ,但 在 交换 区 等 其 他 资源 分 配 时 也 被 大 量 使 用 。 第 5 章 介 绍 存储 管理 ,包括 分 区 、 分 
页 分 段 和 段 页 式 管理 等 。 作 为 进程 管理 与 存储 管理 的 实例 ,第 6 章 和 第 7 章 分 别 介 绍 
Linux 和 Windows NT 的 进程 与 存储 管理 系统 。 第 8 章 介绍 文件 系统 。 第 9 章 讲述 设备 管 
理 技术 。 第 10 音 和 第 11 章 则 在 第 8 章 与 第 9 章 的 基础 上 介绍 Linux 和 Windows NT 的 文 
件 和 设备 管理 方法 。 第 12 章 简 述 了 艇 人 式 操作 系统 的 基本 原理 、. 嵌 人 式 操 作 系统 的 集成 开 
发 环境 及 开发 过 程 。 

本 书 的 讲授 学 时 可 安排 为 约 68 一 76 学 时 : 第 1 章 为 2 学 时 ,第 2 章 为 4 学 时 ,第 3 章 为 
8 一 10 学 时 ,第 4 章 为 6 学 时 ,第 5 章 为 6 一 8 学 时 ,第 6 章 为 8 学 时 ,第 7 章 为 6 学 时 ,第 8 
章 为 8 学 时 ,第 9 章 为 6 学 时 ,第 10 章 与 第 11 章 分 别 为 4 一 6 学 时 和 4 学 时 ,第 12 章 为 6 一 
8 学 时 。 教 师 也 可 根据 自己 的 教学 计划 安排 学 时 。 

本 书 第 1 章 的 1.1 节 至 1.4 节 以 及 1.7 节 由 史 美 林 教 授 编 写 , 第 7 章 和 第 11 章 由 微软 
亚洲 研究 院 张 高 博士 编写 ,第 12 章 由 中 南大 学 宋 虹 编写 ,第 6 章 和 第 10 章 由 红旗 Linux 公 
司 门 小 燕 女 士 提 供 了 资料 ,其 他 章节 由 张 尧 学 编写 。 

在 本 书 的 改编 过 程 中 ,清华 大 学 史 美 林 教 授 和 华北 水 利水 电学 院 朱 贵 良 教授 提供 了 宝 
贵 的 意见 和 修改 建议 ;清华 大 学 杨 华 杰 同志 帮助 整理 和 试 做 了 所 有 习题 和 实验 ;还 有 教育 部 

. . 


领导 和 同事 们 对 编著 者 "不务正业 ”的 容忍 和 给 予 时 间 上 的 便利 。 多 少 个 节假日 不 能 休息 ， 
不 能 和 家 庭 团聚 ,但 家 人 们 仍然 毫 无 怨言 ,以 最 大 的 爱 支 持 我 们 的 工作 ,编著 者 们 对 他 们 致 
以 万 分 的 感谢 ! 没有 大 家 的 支持 ,本 书 的 改编 是 不 可 能 完成 的 。 

由 于 编著 者 水 平 有 限 , 书 中 难免 有 错误 和 不 妥 之 处 ,恳请 广大 读者 批评 指正 。 


编著 者 
2013 年 6 月 
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第 1 章 绪 论 


计算 机 发 展 到 今天 ,从 个 人 计算 机 到 巨型 计算 机 系统 , 毫 无 例外 都 配置 一 种 或 多 种 操作 
系统 。 什 么 是 操作 系统 , 它 具 有 什么 样 的 功能 等 ,将 在 这 一 章 作 简要 阐述 。 为 了 阐明 这 些 问 
题 ,扼要 地 回顾 一 下 操作 系统 的 形成 和 发 展 过 程 是 必要 的 。 为 便于 今后 的 学 习 , 本 章 随后 介 
绍 操作 系统 的 类 型 及 其 特点 ,以 及 研究 操作 系统 的 几 种 观点 。 


1.1 操作 系统 概念 


什么 是 操作 系统 


迄今 ,任何 一 个 计算 机 系统 都 配置 一 种 或 多 种 操作 系统 。 

计算 机 系统 由 两 部 分 组 成 : 硬件 和 软件 。 计 算 机 硬件 通常 由 中 央 处 理 机 (运算 器 和 控 
制 器 )、 存 储 器 ,输入 设备 和 输出 设备 等 部 件 组 成 , 它 构成 了 系统 本 身 和 用 户 作 业 赖 以 活动 的 
物质 基础 和 工作 环境 。 

计算 机 软件 包括 系统 软件 和 应 用 软件 。 系 统 软 件 包括 操作 系统 、 多 种 语言 处 理 程 序 ( 汇 
编 和 编译 程序 等 ) ,连接 装配 程序 、 系 统 实用 程序 和 多 种 工具 软件 等 ;应 用 软件 是 为 应 用 编制 
的 程序 。 

没有 任何 软件 支持 的 计算 机 称 为 裸 机 (bare 
machine), 它 仅仅 构成 了 计算 机 系统 的 物质 基础 ， 
而 实际 呈现 在 用 户 面前 的 计算 机 系统 是 经 过 若干 
层 软 件 改造 的 计算 机 。 图 1. 1 展示 了 这 种 情形 。 

由 图 1.1 可 以 看 出 ,计算 机 的 硬件 和 软件 以 图 1.1 操作 系统 与 硬件 软件 的 关系 
及 应 用 之 间 是 一 种 层次 结构 的 关系 。 裸 机 在 最 里 
层 , 它 的 外 面 是 操作 系统 ,操作 系统 提供 的 资源 管理 功能 和 方便 用 户 的 各 种 服务 功能 把 裸 机 
改造 成 功能 更 强 、 使 用 更 为 方便 的 机 器 ,通常 称 为 虚拟 机 (virtual machine) 或 扩展 机 
(extended machine) ,而 各 种 实用 程序 和 应 用 程序 运行 在 操作 系统 之 上 ,它们 以 操作 系统 作 
为 支撑 环境 ,同时 又 向 用 户 提供 完成 其 作业 所 需 的 各 种 服务 。 

引入 操作 系统 的 目的 可 从 三 方面 来 考察 。 

(1) 从 用 户 的 观点 来 看 ,计算 机 是 为 用 户 提 供 服 务 的 ,计算 机 所 完成 的 任何 工作 都 是 为 
了 满足 用 户 的 计算 或 处 理 需求 。 因 此 ,引入 操作 系统 是 让 计算 机 为 用 户 提供 最 好 的 服务 , 构 
建 一 个 用 户 和 计算 机 之 间 的 和 谐 交 互 环 境 。 这 要 求 计算 机 有 一 个 良好 的 用 户 界面 ,使 用 户 
无 须 了 解 许多 有 关 硬 件 和 系统 软件 的 细节 ,能 够 方便 灵活 地 使 用 计算 机 。 同 时 ,计算 机 还 能 
为 用 户 提 供 一 个 可 靠 和 安全 的 服务 管理 ,以 保证 用 户 得 到 可 靠 安 全 的 服务 。 

(2) 从 系统 管理 人 员 的 观点 来 看 ,引入 操作 系统 是 为 了 合理 地 组 织 计 算 机 工作 流程 , 管 
理 和 分 配 计算 机 系统 硬件 及 软件 资源 ,使 之 能 为 多 个 用 户 高 效率 地 共享 。 因 此 ,操作 系统 是 
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计算 机 资源 的 管理 者 。 

(3) 从 发 展 的 观点 看 ,引入 操作 系统 是 为 了 给 计算 机 系统 的 功能 扩展 提供 支撑 平台 ,使 
之 在 追加 新 的 服务 和 功能 时 更 加 容易 并 且 不 影响 原 有 的 服务 与 功能 。 

综 上 所 述 ,可 以 非 形式 地 把 操作 系统 定义 为 : 操作 系统 是 计算 机 系统 中 的 一 个 系统 软 
件 , 它 是 这 样 一 些 程序 模块 的 集合 一 一 它们 管理 和 控制 计算 机 系统 中 的 硬件 及 软件 资源 , 合 
理 地 组 织 计算 机 工作 流程 ,以 便 有 效 地 利用 这 些 资源 为 用 户 提供 一 个 具有 足够 的 功能 、 使 用 
方便 .可 扩展 .安全 和 可 管理 的 工作 环境 ,从 而 在 计算 机 与 其 用 户 之 间 起 到 接口 的 作用 。 

操作 系统 的 几 个 主要 特点 是 : 它 是 一 个 管理 计算 机 软 硬 件 资源 的 系统 软件 , 它 为 用 户 
提供 尽 可 能 多 的 服务 , 它 的 管理 过 程 根据 用 户 要 求 不 同 而 有 所 不 同 , 但 主要 是 为 了 让 用 户 高 
效率 地 共享 计算 机 软 硬 件 资源 ,但 又 要 保证 其 可 靠 性 、 安 全 性 、 可 用 性 和 可 管理 性 。 


1.2 操作 系统 的 历史 


为 了 更 好 地 理解 操作 系统 的 基本 概念 、 功 能 和 特点 ,本 节 首 先 回顾 操作 系统 形成 和 发 展 
的 历史 过 程 。 

操作 系统 是 由 于 客观 的 需要 而 产生 的 , 它 伴随 着 计算 机 技术 本 身 及 其 应 用 的 日 益 发 展 
而 逐渐 发 展 和 不 断 完善 。 它 的 功能 由 弱 到 强 , 在 计算 机 系统 中 的 地 位 不 断 提 高 。 至 今 , 它 已 
成 为 计算 机 系统 中 的 核心 ,无 一 计算 机 系统 是 不 配置 操作 系统 的 。 

由 于 操作 系统 历来 跟 运 行 其 上 的 计算 机 组 成 与 体系 结构 休戚 与 共 , 因 此 下 面 考察 各 代 
计算 机 ,看 看 它们 的 操作 系统 是 什么 样子 ,具有 哪些 功能 和 特征 。 

人 们 通常 按照 器 件 工艺 的 演变 把 计算 机 发 展 过 程 分 为 4 个 阶段 。 

1946 年 至 20 世纪 50 年 代 末 : 第 一 代 , 电 子 管 时 代 ,无 操作 系统 。 

20 世纪 50 年 代 末 至 60 年 代 中 期 : 第 二 代 , 晶 体 管 时 代 , 批 处 理 系统 。 

20 世纪 60 年 代 中 期 至 70 年 代 中 期 : 第 三 代 , 集 成 电路 时 代 , 多 道 程序 设计 。 

20 世纪 70 年 代 中 期 至 20 世纪 末 : 第 四 代 , 大 规模 和 超大 规模 集成 电路 时 代 , 分 时 
系统 。 

21 世纪 初 开 始 , 以 移动 .分 布 和 网 络 计算 为 代表 ,现代 计算 机 正 向 着 普 适 计算 、 网 格 计 
算 以 及 巨型 微型、 并行、 分 布 、 网 络 化 、 智 能 化 和 生物 信息 化 几 个 方面 发 展 着 。 

适应 上 述 计算 机 发 展 过 程 ,操作 系统 经 历 了 如 下 的 发 展 过 程 : 手工 操作 阶段 (无 操作 系 
统 )、 批 处 理 、 执 行 系统 .多 道 程序 系统 .分 时 系统 、 实 时 系统 .通用 操作 系统 .网络 操作 系统 和 
分 布 式 操作 系统 等 。 


1.2.1 手工 操作 阶段 


在 第 一 代 计 算 机 时 期 ,构成 计算 机 的 主要 元 器 件 是 电子 管 ,计算 机 运算 速度 慢 ( 只 有 几 

千 次 / 秒 ), 没 有 操作 系统 ,甚至 没有 任何 软件 。 用 户 直接 用 机 器 语言 编制 程序 ,并 在 上 机 时 

独占 全 部 计算 机 资源 。 用 户 既是 程序 员 , 又 是 操作 员 。 上 机 完全 是 手工 操作 : 先 把 程序 纸 

带 (或 卡片 ) 装 上 输入 机 ,然后 启动 输入 机 把 程序 和 数据 送 入 计算 机 ,接着 通过 控制 台 开 关 启 

动 程序 运行 。 计 算 完毕 ,打印 机 输出 计算 结果 ,用 户 取 走 并 种 下 纸 带 (或 卡片 );。 第 二 个 用 户 

程序 上 机 , 照 此 办 理 。 这 种 由 一 道 程序 独占 机 器 且 有 人 工 操作 的 情况 ,在 计算 机 速度 较 慢 时 
。2。 


是 允许 的 ,因为 此 时 计算 机 所 需 时 间 相 对 较 长 ,手工 操作 所 占 比 例 还 不 很 大 。 

20 世纪 50 年 代 后 期 ,计算 机 的 运行 速度 有 了 很 大 提高 ,从 每 秒 几 千 次 、 几 万 次 发 展 到 
每 秒 几 十 万 次 上 百 万 次 。 这 时 ,手工 操作 的 慢 速度 和 计算 机 的 高 速度 之 间 形 成 矛盾 ,手工 
操作 与 计算 机 有 效 运行 时 间 之 比 大 大 地 加 大 ,这 种 矛盾 已 经 到 了 不 能 容忍 的 地 步 。 唯 一 的 
解决 办 法 是 摆脱 人 的 手工 操作 ,实现 作业 的 自动 过 渡 。 这 样 就 出 现 了 批 处 理 。 


1.2.2 早期 批 处 理 


在 计算 机 发 展 的 早期 阶段 ,用 户 上 机 时 需要 自己 建立 和 运行 作业 ,并 做 结束 处 理 。 由 于 
没有 任何 用 于 管理 的 软件 ,所 有 的 运行 管理 和 具体 操作 都 由 用 户 自己 承担 。 每 个 作业 都 由 
许多 作业 步 组 成 ,任何 一 步 的 错误 操作 都 可 能 导致 该 作业 从 头 开始 。 在 当时 ,计算 机 的 价格 
是 极其 昂贵 的 ,计算 机 (CPU) 的 时 间 是 非常 宝贵 的 , 尽 可 能 提高 CPU 的 利用 率 成 为 十 分 迫 
切 的 任务 。 

解决 的 途径 有 两 个 : 一 个 是 配备 专门 的 计算 机 操作 员 ,程序 员 不 再 直接 操作 计算 机 , 减 
少 操作 错误 ; 另 一 个 是 进行 批 处 理 (batch processing) ,操作 员 把 用 户 提交 的 作业 分 类 ,把 一 
批 作业 编 成 一 个 作业 执行 序列 。 每 一 批 作 业 将 有 专门 编制 的 监督 程序 Cmonitor) 自动 依次 
处 理 。 

早期 的 批 处 理 可 分 为 两 种 方式 。 

1. 联机 批 处 理 

慢 速 的 输入 输出 (1/O) 设 备 和 主机 直接 相连 。 作 业 的 执行 过 程 如 下 : 

(1) 用 户 提交 作业 ,包括 作业 程序 .数据 以 及 用 作业 控制 语言 编写 的 作业 说 明 书 。 

(2) 作业 被 做 成 穿孔 纸 带 或 卡片 。 

(3) 操作 员 有 选择 地 把 若干 作业 合成 一 批 ,通过 输入 设备 ( 纸 带 输入 机 或 读 卡 机 ) 把 它 
们 存 人 磁带 。 

(4) 监督 程序 读 和 人 一 个 作业 ( 若 系统 资源 能 满足 该 作业 要 求 ) 。 

(5) 从 磁带 调 入 汇编 程序 或 编译 程序 ,将 用 户 作 业 源 程序 翻译 成 目标 代码 。 

(6) 连接 装配 程序 把 编译 后 的 目标 代码 及 所 需 的 子 程序 装配 成 一 个 可 执行 程序 。 

(7) 启动 执行 。 

(8) 执行 完毕 ,由 善后 处 理 程序 输出 计算 结果 。 

(9) 再 读 和 人 一 个 作业 ,重复 (5) 一 (9) 步 。 

(10) 一 批 作业 完成 ,返回 到 (3) ,处 理 下 一 批 作 业 。 

这 种 联机 批 处 理 方式 解决 了 作业 自动 转 接 的 问题 ,从 而 减少 了 作业 建立 和 人 工 操 作 时 
间 。 但 是 在 作业 的 输入 和 执行 结果 的 输出 过 程 中 ,主机 CPU 仍 处 在 等 待 状态 ,这 样 慢 速 的 
输入 输出 设备 和 快速 主机 之 间 仍 处 于 串 行 工作 ,CPU 的 时 间 仍 有 很 大 的 浪费 。 

2. 脱 机 批 处 理 

脱 机 批 处 理 方式 的 显著 特征 是 增加 一 台 不 与 主机 直接 相连 而 专门 用 于 与 输入 输出 设备 
打交道 的 卫星 机 ,如 图 1. 2 所 示 。 

卫星 机 的 功能 如 下 : 

(1) 输入 设备 通过 卫星 机 把 作业 输入 到 输入 带 。 

(2) 输出 带 通 过 卫星 机 将 作业 执行 结果 输出 到 输出 设备 。 


卡片 机 
> 
打印 机 
输出 带 
图 1.2 早期 脱 机 批 处 理 模型 


这 样 ,主机 不 是 直接 与 慢 速 的 输入 输出 设备 打交道 ,而 是 与 速度 相对 较 快 的 磁带 机 发 生 
关系 。 主 机 与 卫星 机 可 以 并 行 工 作 , 二 者 分 工 明 确 , 以 充分 发 挥 主机 的 高 速 计算 能 力 。 因 此 
脱 机 批 处 理 和 早期 联机 批 处 理 相 比 大 大 提高 了 系统 的 处 理 能 

批 处 理 出 现 于 20 世纪 50 年 代 末 到 60 年 代 初 , 它 是 为 了 提高 主机 的 使 用 效率 ,在 解决 
人 机 了 矛盾 (主机 高 速度 和 输入 输出 设备 的 慢 速度 的 矛盾 ) 的 过 程 中 逐步 发 展 起 来 的 。 它 的 出 
现 促使 了 软件 的 发 展 。 再 有 重要 的 是 监督 程序 , 它 管 理 作 业 的 运行 一 一 负责 装 人 和 运行 各 
种 系统 处 理 程序 ,如 汇编 程序 .编译 程序 .连接 装配 程序 和 程序 库 ( 如 输入 输出 标准 程序 等 ) ; 
完成 作业 的 自动 过 渡 , 同 时 也 出 现 了 程序 覆盖 等 程序 设计 技术 。 

批 处 理 克 服 了 手工 操作 的 缺点 ,实现 了 作业 的 自动 过 渡 ,改善 了 主机 CPU 和 输入 输出 
设备 的 使 用 情况 ,提高 了 计算 机 系统 的 处 理 能 力 。 但 它 仍 有 些 缺 点 : 磁带 需 人 工 拆 装 , 既 麻 
烦 又 易 出 错 ;而 男 一 个 更 重要 的 问题 是 系统 的 保护 。 下 面 先 对 在 监督 程序 管理 下 的 解 题 过 
程 进行 分 析 , 如 图 1.3 所 示 。 
监督 程序 

| ee 


标准 输入 程序 编译 程序 ”装配 程序 IO 处 理 程序 
一 一 一 


输入 作业 用 户 程序 


[ 旦 千 


调用 一 些 子 程序 


和 


1 
编译 后 的 用 户 作 业 程 


伍 | 


党 二 


1 
装配 好 的 用 户 作 业 程 序 


一 > 营 


1 
执行 


1 
执行 结果 一 


1 
输出 结果 


图 1.3 监督 程序 管理 下 的 解 题 过 程 


在 进行 批 处 理 过 程 中 ,监督 程序 ,系统 程序 和 用 户 程序 之 间 存 在 着 一 种 调用 关系 ,任何 
一 个 环节 出 问题 ,整个 系统 都 会 停顿 ;用 户 程序 也 可 能 会 破坏 监督 程序 和 系统 程序 ,这 时 ,只 
有 操作 员 进 行 干预 才能 恢复 。20 世纪 60 年 代 初 期 ,硬件 获得 了 两 方面 ( 即 通道 和 中 断 技 
术 ) 的 进展 ,导致 操作 系统 进入 执行 系统 阶段 。 


。 4 。 


通道 是 一 种 专用 处 理 部 件 , 它 能 控制 一 台 或 多 台 输 入 输出 设备 工作 ,负责 输入 输出 设备 
与 主 存 之 间 的 信息 传输 。 它 一 旦 被 启动 就 能 独立 于 CPU 运行 ,这 样 可 使 CPU 和 通道 并 行 
操作 ,而且 CPU 和 多 种 输入 输出 设备 也 能 并 行 操 作 。 中 断 是 指 当 主机 接 到 外 部 信号 (如 输 
和 人 输出 设备 完成 信号 ) 时 ,马上 停止 原来 工作 , 转 去 处 理 这 一 事件 ,处 理 完毕 后 ,主机 回 到 原 
来 的 断 点 继续 工作 。 

借助 于 通道 ,中 断 技术 和 输入 输出 可 在 主机 控制 下 完成 批 处 理 。 这 时 ,原来 的 监督 程序 
的 功能 扩大 了 , 它 不 仅 要 负责 作业 运行 的 自动 调度 ,而 且 还 要 提供 输入 输出 控制 功能 。 这 个 
发 展 了 的 监督 程序 常 驻 内 存 , 称 为 执行 系统 (executive system)。 执 行 系统 实现 的 也 是 输入 
输出 联机 操作 ,和 早期 批 处 理 系统 不 同 的 是 : 输入 输出 工作 是 由 在 主机 控制 下 的 通道 完成 
的 。 主 机 和 通道 .主机 和 输入 输出 设备 都 可 以 并 行 操 作 。 用 户 程序 的 输入 输出 工作 都 由 系 
统 执 行 而 没有 人 工 干预 ,由 系统 检查 其 命令 的 合法 性 ,以 避免 不 合法 的 输入 输出 命令 造成 对 
系统 的 影响 ,从 而 提高 系统 的 安全 性 。 此 时 ,除了 输入 输出 中 断 外 ,其 他 中 断 如 算术 溢出 和 
非法 操作 码 中 断 等 可 以 克服 错误 停机 ,而 时 钟 中 断 可 以 解决 用 户 程序 中 出 现 的 死 循 环 等 。 

许多 成 功 的 批 处 理 系统 在 20 世纪 50 年 代 末 至 60 年 代 初 出 现 ,典型 的 操作 系统 是 
FMS(FORTRAN Monitor System,FORTRAN 监督 系统 ) 和 IBM 7094 机 上 的 IBM 操作 系 
统 IBSYS。 执 行 系统 实现 了 主机 、 通 道 和 输入 输出 设备 的 并 行 操 作 , 提 高 了 系统 效率 ,方便 
用 户 对 输入 输出 设备 的 使 用 。 但 是 ,这 时 计算 机 系统 运行 的 特征 是 单 道 顺序 地 处 理 作 业 , 即 
用 户 作业 仍然 是 一 道 一 道 作 业 顺 序 处 理 。 因 此 可 能 会 出 现 两 种 情况 : 对 于 以 计算 为 主 的 作 
业 , 输 入 输出 量 少 ,外 围 设 备 空 闲 ; 然 而 对 于 以 输入 输出 为 主 的 作业 ,又 会 造成 主机 空 亲 。 这 
样 总 的 来 说 ,计算 机 资源 使 用 效率 仍然 不 高 。 因 此 操作 系统 进入 了 多 道 程序 阶段 : 多 道 程 
序 合理 搭配 ,交替 运行 ,充分 利用 资源 ,提高 效率 。 
1.2.3 多 道 程序 系统 

上 述 批 处 理 系 统 ,每 次 只 调用 一 个 用 户 作 业 程 序 进入 内 存 并 运行 , 称 为 单 道 运 行 。 
图 1.4(a) 给 出 了 单 道 程序 工作 示例 ,图 1.4(b) 给 出 了 多 道 程序 工作 示例 。 
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图 1.4 程序 工作 示例 


在 单 处 理 机 系统 中 ,多 道 程序 运行 的 特点 如 下 : 
(1) 多 道 。 计算 机 内 存 中 同时 存放 几 道 相互 独立 的 程序 。 


(2) 宏观 上 并 行 。 同 时 进入 系统 的 几 道 程序 都 处 于 运行 过 程 中 , 即 它们 先后 开始 了 各 
自 的 运行 ,但 都 未 运行 完毕 。 

(3) 微观 上 串 行 。 实 际 上 ,各 道 程序 轮流 使 用 CPU ,交替 执行 。 

在 批 处 理 系统 中 采用 多 道 程序 设计 技术 ,就 形成 了 多 道 批 处 理 系 统 。 要 处 理 的 许多 作 
业 存 放 在 外 部 存储 器 中 ,形成 作业 队列 ,等 待 运行 。 当 需要 调 入 作业 时 ,将 由 操作 系统 中 的 
作业 调度 程序 对 外 存 中 的 一 批 作业 ,根据 其 对 资源 的 要 求 和 一 定 的 调度 原则 , 调 几 个 作业 进 
和 人 内存, 让 它们 交替 运行 。 当 某 个 作业 完成 后 ,再 调 入 一 个 或 几 个 作业 。 采 用 这 种 处 理 方 
式 , 在 内 存 中 总 是 同时 存在 几 道 程序 ,系统 资源 得 到 比较 充分 的 利用 。 

在 多 道 程序 系统 中 ,要 解决 这 样 一 些 技 术 问题 : 

(1) 并 行 运 行 的 程序 要 共享 计算 机 系统 的 硬件 和 软件 资源 , 既 有 对 资源 的 竞争 ,又 必须 
相互 同步 。 因 此 同步 与 互 斥 机 制 成 为 操作 系统 设计 中 的 重要 问题 。 

(2) 随 着 多 道 程序 的 增加 ,出 现 了 内 存 不 够 用 的 问题 ,提高 内 存 的 使 用 效率 也 成 为 关 
键 。 因 此 出 现 了 诸如 覆盖 技术 、 对 换 技术 和 虚拟 存储 技术 等 内 存 管理 技术 。 

(3) 由 于 多 道 程序 存在 于 内 存 , 为 了 保证 系统 程序 存储 区 和 各 用 户 程 序 存 储 区 的 安全 
可 靠 , 提 出 了 内 存 保护 的 要 求 。 

多 道 程序 系统 的 出 现 标志 着 在 操作 系统 渐 趋 成 熟 的 阶段 先后 出 现 了 作业 调度 管理 、 处 
理 机 管理 ,存储 器 管 理 、 外 部 设备 管理 和 文件 系统 管理 等 功能 。 


1.2.4 分 时 操作 系统 


批 处 理 方式 下 ,用 户 以 脱 机 操作 方式 使 用 计算 机 ,用 户 在 提交 作业 以 后 就 完全 脱离 了 自 
己 的 作业 ,在 作业 运行 的 过 程 中 ,不 管 出 现 什么 情况 ,用 户 都 不 能 加 以 干预 ,只 有 等 该 批 作业 
处 理 结束 ,用 户 才 能 得 到 计算 结果 。 根 据 结 果 再 作 下 一 步 处 理 , 若 有 错 ,还 得 重复 上 述 过 程 。 
这 种 操作 方式 的 好 处 是 计算 机 效率 高 。 不 过 ,用 户 十 分 留恋 手工 操作 阶段 的 联机 工作 方式 ， 
独占 计算 机 ,并 直接 控制 程序 运行 。 但 独占 计算 机 方式 会 造成 资源 效率 低 。 既 能 保证 计算 
机 效率 ,又 能 方便 用 户 使 用 ,成 为 一 种 新 的 追求 目标 。20 世纪 60 年 代 中 期 ,计算 机 技术 和 
软件 技术 的 发 展 使 这 种 追求 成 为 可 能 。 由 于 CPU 速度 不 断 提 高 和 采用 分 时 技术 ,一 台 计 
算 机 可 同时 连接 多 个 用 户 终 端 ,而 每 个 用 户 可 在 自己 的 终端 上 联机 使 用 计算 机 ,好 像 自 己 独 
占 计算 机 一 样 。 

所 谓 分 时 技术 ,就 是 把 处 理 机 的 运行 时 间 分 成 很 短 的 时 间 片 ,按时 间 片 轮流 把 处 理 机 分 
配给 各 联机 作业 使 用 。 若 某 个 作业 在 分 配给 它 的 时 间 片 内 不 能 完成 其 计算 , 则 该 作业 暂时 
中 断 ,把 处 理 机 让 给 另 一 作业 使 用 ,等 待 下 一 轮 时 再 继续 其 运行 。 由 于 计算 机 速度 很 快 , 作 
业 运 行 轮转 得 很 快 ,给 每 个 用 户 的 印象 是 好 像 他 独占 了 一 台 计 算 机 。 而 每 个 用 户 可 以 通过 
自己 终端 向 系统 发 出 各 种 操作 控制 命令 ,完成 作业 的 运行 。 

多 用 户 分 时 操作 系统 是 当今 计算 机 操作 系统 中 最 普遍 使 用 的 一 类 操作 系统 。 


1.2.5 实时 操作 系统 


20 世纪 60 年 代 中 期 计算 机 进入 第 三 代 , 计 算 机 的 性 能 和 可 靠 性 有 了 很 大 提高 ,造价 亦 

大 幅度 下 降 , 导 致 计算 机 应 用 越 来 越 广泛 。 计 算 机 应 用 于 工业 过 程控 制 . 军 事实 时 控制 等 领 

域 就 形成 了 各 种 实时 系统 。 实 时 操作 系统 是 以 在 允许 的 时 间 范 围 之 内 做 出 响应 为 特征 的 。 
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它 要 求 计算 机 对 于 外 来 信息 能 以 足够 快 的 速度 进行 处 理 , 并 在 被 控 对 象 允 许 时 间 范 围 内 做 
出 快速 响应 ,其 响应 时 间 要 求 在 秒 级 .毫秒 级 甚至 微 秒 级 或 更 小 。 实 时 操作 系统 在 伐 入 式 计 
算 中 得 到 了 越 来 越 广泛 的 应 用 。 特 别 是 移动 计算 等 非 PC、PDA( 个 人 数字 助理 ) 和 手机 等 
新 设备 的 出 现 ,更 加 强 了 这 一 趋势 。 

例如 , 随 着 移动 通信 进入 3G 时 代 ,诺基亚 等 公司 研制 的 Symbian 手机 操作 系统 、 微 软 
公司 研制 的 Windows Mobile、Google 公司 等 研制 的 Android 系统 .近年 崛起 的 操作 系统 新 
秀 Linux 等 都 已 有 了 巨大 的 市 场 和 用 户 群 体 。 


1.2.6 通用 操作 系统 


多 道 批 处 理 系统 和 分 时 系统 的 不 断 改进 ,实时 系统 的 出 现 及 其 应 用 日 益 广 泛 ,致使 操作 
系统 日 益 完善 。 在 此 基础 上 ,出 现 了 通用 操作 系统 , 它 可 以 同时 兼 有 多 道 批 处 理 、 分 时 、 实 时 
处 理 的 功能 ,或 其 中 两 种 以 上 的 功能 。 例 如 ,将 实时 处 理 和 批 处 理 相 结合 构成 实时 批 处 理 系 
统 , 在 这 样 的 系统 中 ,首先 保证 优先 处 理 实 时 任务 , 插 空 进行 批 作业 处 理 。 通 常 把 实时 任务 
称 为 前 台 作 业 , 批 作业 称 为 后 台 作 业 。 将 批 处 理 和 分 时 处 理 相 结合 可 构成 分 时 批 处 理 系统 ， 
在 保证 分 时 用 户 的 前 提 下 ,没有 分 时 用 户 时 可 进行 批量 作业 的 处 理 。 同 样 , 分 时 用 户 和 批 处 
理 作业 可 按 前 后 台 方 式 处 理 。 

从 20 世纪 60 年 代 中 期 开始 ,国际 上 开始 研制 大 型 通用 操作 系统 。 这 些 系统 试图 达到 
功能 齐全 .可 适应 各 种 应 用 范围 和 操作 方式 变化 多 端的 环境 的 目标 。 但 是 这 些 系统 本 身 很 
庞大 ,不 仅 付出 了 巨大 的 代价 ,而 且 由 于 系统 过 于 复杂 和 庞大 ,在 解决 其 可 靠 性 .可 维护 性 、 
可 理解 性 和 开放 性 等 方面 都 遇 到 了 很 大 的 困难 。 相 比 之 下 ,UNIX 操作 系统 却 是 一 个 例外 。 
这 是 一 个 通用 的 多 用 户 分 时 交互 型 的 操作 系统 。 它 首先 建立 的 是 一 个 精干 的 核心 ,而 其 功 
能 却 足 以 与 许多 大 型 的 操作 系统 相 媲 美 , 在 核心 层 以 外 可 以 支持 庞大 的 软件 系统 , 它 很 快 得 
到 应 用 和 推广 并 不 断 完 善 ,对 现代 操作 系统 有 着 重大 的 影响 。 目 前 广泛 使 用 的 各 种 工作 站 
级 的 操作 系统 ,例如 SUN 公司 的 Solaris 和 IBM 公司 的 AIX 等 都 是 基于 UNIX 的 操作 系 
统 。Microsoft 公司 的 Windows 系列 操作 系统 ,其 主要 原理 也 是 基于 UNIX 系统 的 。 男 外 ， 
目前 广 为 流传 的 Linux 系统 也 是 从 UNIX 演变 而 来 的 。 

至 此 ,操作 系统 的 基本 概念 .功能 .基本 结构 和 组 成 都 已 形成 并 渐 趋 完善 。 


1.2.7 操作 系统 的 进一步 发 展 


进入 20 世纪 80 年 代 , 随 着 大 规模 集成 电路 工艺 技术 的 飞跃 发 展 以 及 微 处 理 机 的 出 现 
和 发 展 ,掀起 了 计算 机 大 发 展 大 普及 的 浪潮 。 一 方面 迎 来 了 个 人 计算 机 的 时 代 , 同 时 又 向 计 
算 机 网 络 、 分 布 式 处 理 、` 巨 型 计算 机 和 智能 化 方向 发 展 。 操 作 系 统 有 了 进一步 的 发 展 : 
个 人 计算 机 上 的 操作 系统 ,例如 Windows 操作 系统 系列 ; 
典 入 式 操作 系统 ,例如 Symbian 操作 系统 ; 
网 络 操作 系统 ; 
分 布 式 操作 系统 ; 
智能 化 操作 系统 。 


1.3 操作 系统 的 基本 类 型 


通过 上 一 节 的 讨论 已 知 , 随 着 计算 机 技术 和 软件 技术 长 期 发 展 , 已 形成 了 各 种 类 型 的 操 
作 系 统 , 以 满足 不 同 的 应 用 要 求 。 根 据 其 使 用 环境 和 对 作业 处 理 方式 的 不 同 ,操作 系统 的 基 
本 类 型 可 划分 为 如 下 几 种 : 

(1) 批 处 理 操作 系统 (batch processing operating system); 

(2) 分 时 操作 系统 (time sharing operating system); 

(3) 实时 操作 系统 (real time operating system); 

(4) 个 人 计算 机 操作 系统 (personal computer operating system); 

(5) 网 络 操作 系统 (network operating system); 

(6) 分 布 式 操作 系统 (distributed operating system ) 。 

下 面 对 它 们 作 概 要 的 说 明 。 


1.3.1 批 处 理 操作 系统 


批 处 理 操作 系统 是 一 种 早期 的 大 型 机 用 操作 系统 。 不 过 ,现代 操作 系统 大 都 具有 批 处 
理 功 能 。 图 1.5 给 出 了 批 处 理 系统 中 的 作业 处 理 步 又 及 状态 。 
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图 1.5 批 处 理 系统 中 作业 处 理 步骤 及 状态 


批 处 理 系统 的 主要 特征 如 下 : 

(1) 用 户 脱 机 使 用 计算 机 。 用 户 提交 作业 之 后 直到 获得 结果 之 前 就 不 再 和 计算 机 打 交 
道 。 作 业 提 交 的 方式 可 以 是 直接 交 给 计算 中 心 的 管理 操作 员 ,也 可 以 是 通过 远程 通信 线路 
提交 。 提 交 的 作业 由 系统 外 存 收容 成 为 后 备 作 业 。 

(2) 成 批 处 理 。 操 作 员 把 用 户 提 交 的 作业 分 批 进行 处 理 。 每 批 中 的 作业 将 由 操作 系统 
或 监督 程序 负责 作业 间 自 动 调度 执行 。 

(3) 多 道 程序 运行 。 按 多 道 程 序 设 计 的 调度 原则 ,从 一 批 后 备 作业 中 选取 多 道 作 业 调 
和 人 内存 并 组 织 它们 运行 ,成 为 多 道 批 处 理 。 

多 道 批 处 理 系统 的 优点 是 由 于 系统 资源 为 多 个 作业 所 共享 ,其 工作 方式 是 作业 之 间 自 
动 调度 执行 ,并 在 运行 过 程 中 用 户 不 干预 自己 的 作业 ,从 而 大 大 提高 了 系统 资源 的 利用 率 和 
作业 吞吐 量 。 其 缺点 是 无 交互 性 ,用 户 一 旦 提交 作业 就 失去 了 对 其 运行 的 控制 能 力 ; 而 且 是 
批 处 理 的 ,作业 周转 时 间 长 ,用户 使 用 不 方便 。 

值得 一 提 的 是 ,不 要 把 多 道 程序 系统 (multiprogramming) 和 多 重 处 理 系 统 (multipro- 
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cessing) 相 混淆 。 一 般 讲 ,多 重 处 理 系统 配置 多 个 CPU ,因而 能 真正 同时 执行 多 道 程序 。 当 
然 , 要 想 有 效 地 使 用 多 重 处 理 系统 ,必须 采用 多 道 程 序 设 计 技术 ;反之 不 然 , 多 道 程序 设计 原 
则 上 不 一 定 要 求 有 多 重 处 理 系统 的 支持 。 多 重 处 理 系 统 比 起 单 处 理 系统 来 说 , 虽 增 加 了 硬 
件 设施 , 却 换 来 了 提高 系统 吞吐 量 ` 可 靠 性 .计算 能 力 和 并 行 处 理 能 力 等 好 处 。 


1.3.2 分 时 系统 


分 时 系统 一 般 采 用 时 间 片 轮转 的 方式 ,使 一 台 计 算 机 为 多 个 终端 用 户 服务 ,对 每 个 用 户 
能 保证 足够 快 的 响应 时 间 ,并 提供 交互 会 话 能 力 。 因 此 它 具 有 下 述 特点 。 

(1) 交互 性 。 交 互 会 话 工作 方式 给 用 户 带 来 了 许多 好 处 。 第 一 ,用 户 可 以 在 程序 动态 
运行 情况 下 对 其 加 以 控制 ,从 而 加 快 调 试 过 程 ,提供 了 软件 开发 的 良好 环境 。 第 二 ,用 户 上 
机 提交 作业 方便 。 特 别 对 于 远程 终端 用 户 ,不 必 将 其 作业 交 给 机 房 , 在 自己 的 终端 上 就 可 以 
提交 调试 并 运行 其 程序 。 第 三 ,分 时 系统 还 为 用 户 之 间 进 行 合 作 提 供 方便 。 他 们 可 以 通过 
文件 系统 、 电 子 邮 件 或 其 他 通信 机 制 彼 此 交换 数据 和 信息 ,共同 完成 某 项 任务 。 

(2) 多 用 户 同 时 性 。 多 个 用 户 同 时 在 自己 的 终端 上 上 机 ,共享 CPU 和 其 他 资源 ,充分 
发 挥 系统 的 效率 。 

(3) 独立 性 。 由 于 采用 时 间 轮 转 方式 使 一 台 计 算 机 同时 为 多 个 终端 服务 ,对 于 每 个 用 
户 的 操作 命令 又 能 快速 响应 ,因此 ,用 户 都 感觉 不 到 有 别人 也 在 使 用 该 台 计 算 机 ,如 同 自己 
独占 计算 机 一 样 。 

分 时 操作 系统 是 一 个 联机 (on-line) 多 用 户 (multiruser) .交互 式 (interactive) 的 操作 系 
统 。UNIX 是 当今 最 流行 的 一 种 多 用 户 分 时 操作 系统 ,但 CTSS(Compatible Time Sharing 
System) 和 MUTICSCMULTIplexed Information and Computing Service) 这 两 个 系统 也 是 
值得 一 提 的 。 前 者 是 一 个 实验 性 的 分 时 系统 ,在 1963 年 由 MIT 研制 成 功 。 后 者 是 由 
MIT Bell 实验 室 和 GE 公司 联合 在 1965 年 开始 设计 的 ,尽管 最 后 它 并 没有 取得 成 功 ,但 对 
UNIX 的 研制 是 有 影响 的 。 


1.3.3 实时 系统 


实时 系统 是 另外 一 类 联机 的 操作 系统 。 它 主要 是 随 着 计算 机 应 用 于 实时 控制 和 实时 信 
息 处 理 领域 中 而 发 展 起 来 的 。 

实时 系统 的 主要 特点 是 提供 即时 响应 和 高 可 靠 性 。 系 统 必须 保证 对 实时 信息 的 分 析 和 
处 理 的 速度 比 其 进入 系统 的 速度 要 快 ,而 且 系 统 本 身 要 安全 可 靠 , 因 为 像 生产 过 程 的 实时 控 
制 . 武 器 系统 的 实时 控制 .航空 订 票 ,银行 业务 等 实时 事务 系统 ,信息 处 理 的 延误 或 丢失 往往 
会 带 来 不 堪 设 想 的 后 果 。 实 时 系统 往往 具有 一 定 的 专用 性 , 它 大 多 用 于 艇 入 式 计 算 中 。 与 
批 处 理 系统 和 分 时 系统 相 比 ,实时 系统 的 资源 利用 率 可 能 较 低 。 

设计 实时 操作 系统 要 考虑 这 样 一 些 因素 : 

(1) 实时 时 钟 管理 (定时 处 理 和 延 时 处 理 )。 

(2) 连续 的 人 -机 对 话 , 这 对 实时 控制 往往 是 必需 的 。 

(3) 过 载 保 护 。 在 实时 系统 中 ,进入 系统 的 实时 任务 的 时 间 和 数目 有 很 大 的 随意 性 , 因 
而 在 某 一 时 刻 有 可 能 超出 系统 的 处 理 能 力 , 这 就 是 所 谓 过 载 问 题 , 要 求 采取 过 载 保 护 措施 。 
例如 ,对 于 短期 过 载 ,把 输入 任务 按 一 定 的 策略 在 缓冲 区 排队 ,等 待 调度 ;对 于 持续 性 过 载 ， 
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可 能 要 拒绝 某 些 任务 的 输入 ;在 实时 控制 系统 中 , 则 应 及 时 处 理 某 些 任 务 ,放弃 某 些 任务 或 
降低 对 某 些 任务 的 服务 频率 。 

(4) 高 度 可 靠 性 和 安全 性 需 采 取 宛 余 措 施 。 双 机 系统 前 后 台 工 作 , 包 括 必 要 的 保密 措 
施 等 。 
1.3.4 通用 操作 系统 


批 处 理 系统 .分 时 系统 和 实时 系统 是 操作 系统 的 3 种 基本 类 型 ,在 此 基础 上 又 发 展 了 具 
有 多 种 类 型 操作 特征 的 操作 系统 , 称 为 通用 操作 系统 。 它 可 以 同时 兼 有 批 处 理 \ 分 时 、 实 时 
处 理 和 多 重 处 理 的 功能 。 


1.3.5 个 人 计算 机 上 的 操作 系统 


个 人 计算 机 上 的 操作 系统 是 联机 的 交互 式 单 用 户 操 作 系 统 , 它 提 供 的 联机 交互 功能 与 
通用 分 时 系统 所 提供 的 很 相似 。 由 于 是 个 人 专用 ,因此 在 多 用 户 和 分 时 所 要 求 的 对 处 理 机 
调度 .存储 保护 方面 将 会 简单 得 多 。 然 而 ,由 于 个 人 计算 机 的 应 用 普及 ,对 于 提供 更 方便 友 
好 的 用 户 接口 的 要 求 会 越 来 越 迫 切 。 

多 媒体 技术 已 迅速 进入 个 人 计算 机 系统 ,多 媒体 计算 机 给 办 公 室 、 家 庭 和 个 人 提供 声 、 
文 .图 数据 并 成 的 全 面 的 信息 服务 。 它 要 求 计算 机 具有 高 速 信号 处 理 , 大 容量 的 内 存 和 外 
存 大 数据 量 宽 频带 传输 等 能 力 , 能 同时 处 理 多 个 实时 事件 。 要 求 有 一 个 具有 高 速 数据 处 理 
能 力 的 实时 多 任务 操作 系统 。 

目前 在 个 人 计算 机 上 使 用 的 操作 系统 以 Windows 系列 和 Linux 为 主 。 


1.3.6 网 络 操作 系统 
计算 机 网 络 是 通过 通信 设施 将 物理 上 分 散 的 .具有 自治 功能 的 多 个 计算 机 系统 互联 起 
来 的 ,实现 信息 交换 .资源 共享 .可 互 操作 和 协作 处 理 的 系统 。 它 具有 以 下 特征 ， 


(1) 计算 机 网 络 是 一 个 互联 的 计算 机 系统 的 群体 。 这 些 计 算 机 系统 在 物理 上 是 分 散 
的 ,可 在 一 个 房间 里 ,在 一 个 单位 里 ,在 一 个 城市 或 几 个 城市 里 ,甚至 在 全 国 或 全 球 范 围 内 。 


(2) 这 些 计算 机 是 自治 的 ,每 台 计 算 机 有 自己 的 操作 系统 ,各 自 独 立 工作 ,它们 在 网 络 
协议 控制 下 协同 工作 。 


(3) 系统 互联 要 通过 通信 设施 (硬件 和 软件 ) 来 实现 。 

(4) 系统 通过 通信 设施 执行 信息 交换 .资源 共享 、 互 操作 和 协作 处 理 , 实 现 多 种 应 用 要 
求 。 互 操作 (interoperation 或 interoperability) 和 协作 处 理 (interworking) 是 计算 机 网 络 应 
用 中 更 高 层次 要 求 的 特征 。 它 需要 有 一 个 环境 支持 互联 的 网 络 中 的 异种 计算 机 系统 之 间 的 
进程 通信 ,实现 协同 工作 和 应 用 集成 。 

网 络 操作 系统 的 研制 开发 是 在 原来 各 自 的 计算 机 操作 系统 的 基础 上 进行 的 ,按照 网 络 
体系 结构 的 各 个 协议 标准 进行 开发 ,包括 网 络 管理 .通信 ,资源 共享 、 系统 安 全 和 多 种 网 络 应 
用 服务 等 达到 上 述 诸 方面 的 要 求 。 

由 于 网 络 计 算 的 出 现 和 发 展 ,现代 操作 系统 的 主要 特征 之 一 就 是 具有 上 网 功能 ,因此 ， 
除了 在 20 世纪 90 年 代 初 期 Novell 公司 的 NetWare 等 系统 被 称 为 网 络 操作 系统 之 外 ,人 们 
一 般 不 再 特 指 某 个 操作 系统 为 网 络 操作 系统 。 
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1.3.7 分 布 式 操作 系统 


粗 看 起 来 ,分 布 式 系统 与 计算 机 网 络 系统 没有 多 大 区 别 。 分 布 式 系统 也 可 以 定义 为 通 
过 通信 网 络 将 物理 上 分 布 的 .具有 自治 功能 的 数据 处 理 系统 或 计算 机 系统 互联 起 来 ,实现 信 
息 交 换 和 资源 共享 ,协作 完成 任务 。 但 是 有 以 下 一 些 明显 的 区 别 应 予 考虑 : 

(1) 作为 计算 机 网 络 ,现在 已 制定 了 明确 的 通信 网 络 协 议 体 系 结构 及 一 系列 协议 族 。 
无 论 是 广域网 (WAN) 还 是 局 域 网 (LAN), 即 ISO/OSI 开放 式 系统 互 连 体系 结构 及 一 系列 
标准 协议 (或 IEEE、CCITT 相应 的 标准 等 ), 计 算 机 网 络 的 开发 都 遵循 协议 ,而 对 于 各 种 分 
布 式 系 统 并 没有 制定 标准 的 协议 。 当 然 ,计算 机 网 络 也 可 认为 是 一 种 分 布 式 系统 。 

(2) 分 布 式 系统 要 求 一 个 统一 的 操作 系统 ,实现 系统 操作 的 统一 性 。 为 了 把 数据 处 理 
系统 的 多 个 通用 部 件 合并 成 为 一 个 具有 整体 功能 的 系统 ,必须 引入 一 个 高 级 操作 系统 。 各 
处 理 机 有 自己 的 私有 操作 系统 ,必须 有 一 个 策略 使 整个 系统 融 为 一 体 , 这 就 是 高 级 操作 系统 
的 任务 , 它 可 以 采用 两 种 形式 ,一 种 形式 是 在 每 个 处 理 机 的 私有 操作 系统 之 外 独立 存在 , 私 
有 操作 系统 可 以 识别 和 调用 它 ; 另 一 种 形式 是 在 各 处 理 机 私有 操作 系统 的 基础 上 加 以 扩展 。 
对 于 各 个 物理 资源 的 管理 ,高 级 操作 系统 和 各 私有 操作 系统 之 间 , 不 允许 有 明显 的 主 从 管理 

在 计算 机 网 络 中 ,实现 全 网 统一 管理 的 网 络 管理 系统 已 成 为 越 来 越 重 要 的 组 成 部 分 。 

(3) 系统 的 透明 性 。 分 布 式 操作 系统 负责 全 系统 的 资源 分 配 和 调度 、 任 务 划 分 、 信 息 传 
输 控 制 协调 工作 ,并 为 用 户 提供 一 个 统一 的 界面 和 标准 的 接口 ,用 户 通 过 这 一 界面 实现 所 需 
要 的 操作 和 使 用 系统 资源 ,至 于 操作 定 在 哪 一 台 计 算 机 上 执行 或 使 用 哪 台 计算 机 的 资源 则 
是 系统 的 事 , 用 户 是 不 用 知道 的 , 即 系统 对 用 户 是 透明 的 。 但 是 对 计算 机 网 络 , 若 一 台 计算 
机 上 的 用 户 希 望 使 用 另 一 台 计 算 机 上 的 资源 , 则 必须 明确 指明 是 哪 台 计算 机 。 

(4) 分 布 式 系统 的 基础 是 网 络 。 它 和 常规 网 络 一 样 具 有 模块 性 、 并 行 性 、 自 治 性 和 通用 
性 等 特点 ,但 它 比 常规 网 络 又 有 进一步 的 发 展 。 因 为 分 布 式 系统 已 不 仅 是 一 个 物理 上 的 松 
散 耦 合 系统 ,同时 还 是 一 个 迎 辑 上 紧密 耦合 的 系统 。 分 布 式 系统 由 于 更 强调 分 布 式 计 算 和 
处 理 ,因此 对 于 多 机 合作 和 系统 重 构 、 坚 强 性 和 容错 能 力 有 更 高 的 要 求 ,希望 系统 有 更 短 的 
响应 时 间 ,高 吞吐 量 和 高 可 靠 性 。 

(5) 分 布 式 系统 还 处 在 研究 阶段 ,目前 还 没有 真正 实用 的 系统 。 而 计算 机 网 络 已 经 在 
各 个 领域 得 到 广泛 的 应 用 。 

20 世纪 90 年 代 出 现 的 网 络 计 算 (network computing) 已 使 分 布 式 系统 变 得 越 来 越 现 
实 。 特 别 是 SUN 公司 的 Java 语言 和 运行 在 各 种 通用 操作 系统 之 上 的 Java 虚拟 机 和 Java 
OS 的 出 现 , 更 进一步 加 快 了 这 一 趋势 。 另 外 ,软件 构件 技术 的 发 展 也 加 快 了 分 布 式 操 作 系 
统 的 实现 。 


1.4 操作 系统 功能 


如 前 所 述 ,操作 系统 的 职能 是 管理 和 控制 计算 机 系统 中 的 所 有 硬件 和 软件 资源 ,合理 地 组 

织 计算 机 工作 流程 ,并 为 用 户 提 供 一 个 良好 的 工作 环境 和 友好 的 接口 。 计 算 机 系统 的 主要 硬 

件 资源 有 处 理 机 存储 器 、 外 存储 器 和 输入 输出 设备 。 软 件 和 信息 资源 往往 以 文件 形式 存储 在 
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外 存储 器 。 下 面 从 资源 管理 和 用 户 接口 的 观点 分 5 个 方面 来 说 明 操 作 系统 的 基本 功能 。 
1.4.1 处 理 机 管理 


在 单 道 作 业 或 单 用 户 的 情况 下 ,处理 机 为 一 个 作业 或 一 个 用 户 所 独占 ,对 处 理 机 的 管理 
十 分 简单 。 但 在 多 道 程序 或 多 用 户 的 情况 下 ,要 组 织 多 个 作业 同时 运行 ,就 要 解决 处 理 机 分 
配 调度 策略 .分 配 实 施 和 资源 回收 等 问题 。 这 就 是 处 理 机 管理 功能 。 正 是 由 于 操作 系统 对 
处 理 机 管理 策略 的 不 同 ,其 提供 的 作业 处 理 方式 也 就 不 同 ,例如 批 处 理 方式 、 分 时 处 理 方式 
和 实时 处 理 方式 。 呈 现在 用 户 面前 ,就 成 为 了 具有 不 同性 质 的 操作 系统 。 


1.4.2 存储 管理 


存储 管理 的 主要 工作 是 对 存储 器 进行 分 配 、 保 护 和 扩充 的 管理 。 

(1) 内 存 分 配 。 在 内 存 中 除了 操作 系统 和 其 他 系统 软件 外 ,还 要 有 一 个 或 多 个 用 户 程 
序 。 如 何 分 配 内 存 , 以 保证 系统 及 各 用 户 程序 的 存储 区 互 不 冲突 ,这 是 内 存 分 配 问题 。 

(2) 存储 保护 。 系 统 中 有 多 个 程序 在 和 运行, 如何 保 证 一 道 程序 在 执行 过 程 中 不 会 有 意 
或 无 意 地 破坏 另 一 道 程 序 ? 如 何 保证 用 户 程 序 不 会 破坏 系统 程序 ? 这 是 存储 保护 要 解决 的 
问题 。 

(3) 内 存 扩充 。 当 用 户 作 业 所 需要 的 内 存量 超过 计算 机 系统 所 提供 的 内 存 容量 时 ,如 何 
把 内 部 存储 器 和 外 部 存储 器 结合 起 来 管理 ,为 用 户 提供 一 个 容量 比 实际 内 存 大 得 多 的 虚拟 存 
储 器 ,而 用 户 使 用 这 个 虚拟 存储 器 和 使 用 内 存 一 样 方便 ,这 就 是 内 存 扩充 所 要 完成 的 任务 。 


1.4.3 设备 管理 


(1) 通道 .控制 器 和 输入 输出 设备 的 分 配 和 管理 。 现 代 计 算 机 常常 配置 有 种 类 很 多 的 
输入 输出 设备 ,这 些 设备 具有 很 不 相同 的 操作 性 能 ,特别 是 它们 对 信息 传输 和 处 理 的 速度 差 
别 很 大 ,并 且 , 它 们 常常 是 通过 通道 控制 器 与 主机 发 生 联系 的 。 设 备 管理 的 任务 就 是 根据 一 
定 的 分 配 策略 ,把 通道 .控制 器 和 输入 输出 设备 分 配给 请 求 输入 输出 操作 的 程序 ,并 启动 设 
备 完 成 实际 的 输入 输出 操作 。 为 了 尽 可 能 发 挥 设 备 和 主机 的 并 行 工 作 能 力 , 常 需要 采用 虚 
拟 技术 和 缓冲 技术 。 

(2) 设备 独立 性 。 输 入 输出 设备 种 类 很 多 ,使 用 方法 各 不 相同 。 设 备 管理 应 为 用 户 提 
供 一 个 良好 的 界面 ,而 不 必 去 涉及 具体 的 设备 特性 ,以 使 用 户 能 方便 、 灵 活 地 使 用 这 些 设备 。 


1.4.4 信息 管理 (文件 系统 管理 ) 


上 述 3 种 管理 都 是 针对 计算 机 的 硬件 资源 的 管理 。 信 息 管理 (文件 系统 管理 ) 则 是 对 系 
统 的 软件 资源 的 管理 。 

我 们 把 程序 和 数据 统称 为 信息 或 文件 。 一 个 文件 在 暂时 不 用 时 ,就 被 放 到 外 部 存储 器 
(如 磁盘 、 磁 带 或 光盘 等 ) 上 保存 起 来 。 这 样 , 外 存 上 保存 了 大 量 的 文件 。 对 这 些 文件 如 不 能 
很 好 地 管理 ,就 会 引起 混乱 ,甚至 遭 到 破坏 。 这 就 是 管理 信息 文件 需要 解决 的 问题 。 

信息 的 共享 ,保密 和 保护 也 是 文件 系统 所 要 解决 的 。 如 果 系 统 允许 多 个 用 户 协同 工作 ， 
那么 就 应 该 允许 用 户 共 享 信息 文件 。 但 这 种 共享 应 该 是 受 控制 的 ,应 该 有 授权 和 保密 机 制 。 
还 要 有 一 定 的 保护 机 制 以 免 文 件 被 非 授 权 用 户 调用 和 修改 ,即使 在 意外 情况 下 ,如 系统 失效 
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或 用 户 对 文件 使 用 不 当 , 也 能 尽量 保护 信息 免 遭 破坏 。 也 就 是 说 ,系统 是 安全 可 靠 的 。 
1.4.5 用 户 接 口 


上 述 4 种 管理 是 操作 系统 对 资源 的 管理 。 除 此 以 外 ,操作 系统 还 为 用 户 提 供 方 便 灵活 
地 使 用 计算 机 的 手段 , 即 提供 一 个 友好 的 用 户 接 口 。 一 般 来 说 ,操作 系统 提供 两 种 方式 的 接 
口 来 和 用 户 发 生 关系 ,为 用 户 服务 。 

一 种 用 户 接口 是 程序 一 级 的 接口 , 即 提供 一 组 广义 指令 (或 称 系统 调用 、 程 序 请 求 ) 供 用 
户 程序 和 其 他 系统 程序 调用 。 当 这 些 程序 要 求 进行 数据 传输 文件 操作 或 有 其 他 资源 要 求 
时 ,通过 这 些 广义 指令 向 操作 系统 提出 申请 ,并 由 操作 系统 代为 完成 。 

另 一 种 接口 是 作业 一 级 的 接口 ,提供 一 组 控制 操作 命令 (或 称 作 业 控 制 语言 ,或 像 UNIX 
中 的 Shell 命令 语言 ) 供 用 户 去 组 织 和 控制 自己 作业 的 运行 。 人 全 1 
脱 机 控制 和 联机 控制 。 操 作 系统 提供 脱 机 控制 作业 语言 和 联机 控制 作业 控制 语 


1.5 计算 机 硬件 简介 


如 前 所 述 ,操作 系统 管理 和 控制 计算 机 系统 中 所 有 软 硬 件 资源 。 同 时 ,因为 操作 系统 是 
一 个 运行 于 硬件 之 上 的 系统 软件 ,所 以 必须 对 操作 系统 运行 的 硬件 环境 有 所 了 解 。 本 节 简 
要 介绍 计算 机 硬件 系统 。 


1.5.1 计算 机 的 基本 硬件 元 素 


构成 计算 机 的 基本 硬件 元 素 有 4 种 : 处 理 器 ,存储 器 .输入 输出 控制 与 总 线 、 外 部 设备 。 
这 些 基本 元 素 的 逻辑 关系 如 图 1.6 所 示 。 


内 存 
PC MAR | 程序 _ 
: PC : 程序 计数 器 
MBR_|| 总线 | 站 可 | IR : 指令 寄存 器 
IOAR MAR : 内 存 地 址 寄存 器 
处 理 器 。” 于 一 = MBR : 内 存 缓冲 寄存 器 
IOBR JIOAR : IO 地址 寄存 器 
IOBR :IO 缓冲 寄存 器 
IO 
控制 器 | | 缓冲 -一 外 部 
设备 
IO 控制 


图 1.6 计算 机 的 基本 硬件 元 素 


处 理 器 控制 和 执行 计算 机 的 指令 操作 。 一 台 计 算 机 中 可 以 有 多 个 处 理 器 或 单个 处 理 
器 。 多 处 理 器 和 单 处理 器 的 计算 机 操作 系统 在 设计 和 功能 上 都 有 较 大 区 别 , 本 书 主要 讨论 
单 处 理 器 的 操作 系统 。 单 处 理 器 也 称 CPU。 存 储 器 用 来 储存 数据 和 程序 。 存 储 器 可 分 为 
内 存 与 外 存 ,以 及 用 于 数据 和 程序 暂时 存储 用 的 缓冲 器 与 高 速 缓存 (cache) 等 。 

输入 输出 控制 器 与 缓冲 器 主要 用 来 控制 和 暂时 存储 外 部 设备 与 计算 机 内 存 之 间 交 换 的 
数据 和 程序 。 
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外 部 设备 范围 很 广 ,它们 是 获取 和 输出 数据 与 程序 的 基本 单位 ,包括 数字 式 设备 和 模拟 
式 设备 。 不 过 ,模拟 式 设备 要 通过 模 / 数 转换 后 才能 把 模拟 信号 输入 到 计算 机 ,而 计算 机 输 
出 的 数字 信号 则 要 通过 数 / 模 转换 之 后 才能 在 模拟 设备 上 显示 或 输出 。 

计算 机 系统 的 各 种 设备 通过 总 线 互 相连 接 。 总 线 是 连接 计算 机 各 部 件 的 通信 线路 。 计 
算 机 系统 的 总 线 有 单 总 线 和 多 总 线 之 分 。 单 总 线 是 指 处 理 机 、 外 部 设备 和 存储 器 等 都 连接 
在 一 起 的 总 线 结构 ,而 多 总 线 则 指 把 系统 的 CPU 和 内 存 分 开 连 接 , 外 部 设备 和 外 存 等 也 用 
其 他 总 线 分 开 连 接 进 行 管理 和 数据 传送 的 总 线 结构 。 显 然 ,不同 的 总 线 结构 对 操作 系统 的 
设计 和 性 能 有 不 同 的 影响 。 


1.5.2 与 操作 系统 相关 的 几 种 主要 寄存 器 


寄存 器 与 操作 系统 密切 相关 ,是 在 处 理 机 中 交换 数据 的 速度 比 内 存 更 快 .体积 也 更 小 、 
而 价格 又 更 贵 的 暂 存 器 件 。 寄 存 器 的 功能 可 分 为 两 类 , 即 用 户 可 编程 的 寄存 器 以 及 控制 与 
状态 寄存 器 。 机 器 语言 或 汇编 语言 的 程序 员 可 对 用 户 可 编程 寄存 器 进行 操作 ,以 获得 更 高 
的 执行 效率 等 。 而 控制 与 状态 寄存 器 则 被 用 来 对 处 理 机 的 优先 级 、 保 护 模 式 或 用 户 程序 执 
行 时 的 调用 关系 等 进行 控制 和 操作 。 

一 般 来 说 ,用 户 可 编程 寄存 器 和 控制 与 状态 寄存 器 之 间 没 有 严格 的 区 分 和 限制 ,在 不 同 
的 系统 中 ,寄存 器 的 功能 和 作用 不 完全 相同 。 

1. 用 户 可 编程 寄存 器 

典型 的 用 户 可 编程 寄存 器 包括 以 下 几 种 。 

(1) 数据 寄存 器 。 编 程 人 员 可 以 通过 程序 赋予 数据 寄存 器 众多 的 功能 。 一 般 来 说 ,对 
数据 进行 操作 的 任何 机 器 指令 都 被 允许 访问 数据 寄存 器 。 不 过 ,根据 硬件 设置 的 规定 ,这 些 
寄存 器 也 可 能 只 被 允许 进行 浮 点 运算 或 被 其 他 某 些 规定 所 限制 。 

(2) 地 址 寄存 器 。 一 般 用 来 存放 内 存 中 某 个 数据 或 指令 的 地 址 ,或 者 存放 某 段 数 据 与 
指令 的 入口 地 址 以 及 被 用 来 进行 更 复杂 的 地 址 计算 。 下 面 几 种 寄存 器 都 可 被 认为 是 地 址 寄 
存 器 : 

@ 地 址 标识 位 寄存 器 ; 

@ 内 存 管理 用 各 种 始 地 址 寄存 器 ; 

@ 堆栈 指针 ， 

@ 设备 地 址 寄存 器 等 。 

(3) 条 件 码 寄存 器 。 也 称 标志 寄存 器 ,其 比特 位 由 处 理 机 硬件 设置 。 例 如 ,一 次 算术 运 
算 可 能 导致 条 件 码 寄存 器 被 设置 为 正 . 负 、 零 或 溢出 。 

2. 控制 与 状态 寄存 器 

典型 的 控制 与 状态 寄存 器 包括 以 下 几 种 : 

(1) 程序 计数 器 (PC)。 该 计数 器 内 装 有 下 一 周期 被 执行 指令 的 地 址 。 

(2) 指令 寄存 器 (IR)。 该 寄存 器 内 装 有 待 执行 的 指令 。 

(3) 程序 状态 字 (PSW) 寄 存 器 。 该 寄存 器 的 各 个 比特 位 代表 系统 中 当前 的 各 种 不 同 状 
态 与 信息 ,例如 执行 模式 是 否 允 许 中 断 等 。 

(4) 中 断 现场 保护 寄存 器 。 如 果 系 统 允 许 不 同类 型 的 中 断 存在 , 则 会 设置 一 组 中 断 现 
场 保护 寄存 器 以 便 保存 被 中 断 程 序 的 现场 和 链接 中 断 恢 复 处 。 

(5) 过 程 调用 堆栈 。 用 来 存放 过 程 调 用 时 的 调用 名 、 调 用 参数 以 及 返回 地 址 等 。 
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寄存 器 被 广泛 应 用 于 计算 机 系统 中 ,它们 与 操作 系统 有 着 非常 直接 和 密切 的 关系 。 事 
实 上 ,操作 系统 设计 人 员 只 有 在 完全 掌握 和 了 解 硬 件 厂 商 所 提供 的 各 种 寄存 器 的 功能 和 接 
口 之 后 ,才能 进行 操作 系统 设计 。 


1.5.3 存储 器 的 访问 速度 


硬件 厂商 提供 了 不 同 种 类 的 存储 器 件 , 这 些 存 储 器 件 包 括 以 下 两 类 : 可 移动 存储 介质 ( 例 
如 光盘 磁盘 和 磁带 等 ) .硬盘 .磁盘 缓存 (disk cache) .内存 高速 缓 存 以 及 寄存 器 等 。 设 计 人 员 
应 对 各 种 存储 器 件 的 访问 速度 和 性 能 等 有 充分 了 解 ,才能 


在 设计 中 以 最 好 的 性 能 价格 比 设计 存储 管理 系统 。 坷 存 吕 
一 般 来 说 ,容量 越 大 的 存储 介质 ,访问 速度 会 越 慢 , 但 yy | | 用 和 

单位 存储 的 成 本 越 低 ,例如 光盘 和 磁盘 。 反 过 来 说 ,如 果 党 硬盘 缓存 

存储 介质 的 访问 速度 越 高 , 则 它 的 成 本 也 会 越 高 ,例如 寄居 硬盘 

存 器 。 光盘 、 磁 盘 
存储 器 件 的 访问 速度 与 存储 量 的 关系 如 图 1. 7 所 示 。 存储 量 


除了 上 述 的 寄存 器 与 存储 介质 之 外 ,与 操作 系统 设计 ”图 1.7 存储 介质 的 访问 速度 
相关 的 硬件 器 件 还 有 中 断 机 构 和 输入 输出 设备 控制 部 分 ， 
例如 通道 和 DMA 咒 件 等 ,这 些 部 分 将 在 后 面相 关 童 节 中 介绍 。 


1.5.4 指令 的 执行 与 中 断 


计算 机 提供 的 最 基本 功能 是 执行 指令 。 任 何 应 用 程序 都 只 有 通过 指令 的 执行 才能 得 以 
完成 。 执 行 指令 的 基本 过 程 分 为 两 步 , 即 处 理 机 从 内 存 读 入 指令 的 过 程 和 指令 执行 的 过 程 。 
其 中 , 读 指 令 是 根据 程序 计数 器 (PC) 所 指 的 地 址 读 和 人 ,而 执行 的 指令 则 是 指令 寄存 器 (IR) 
中 的 指令 。 

指令 的 读 入 和 执行 过 程 称 为 一 个 执行 周期 。 一 个 指令 的 基本 执行 周期 如 图 1. 8 所 示 。 

指令 的 执行 涉及 处 理 机 与 内 存 之 间 的 数据 传输 ,或 者 是 处 理 机 与 外 部 设备 之 间 的 数据 
传输 等 。 指 令 的 执行 也 涉及 数据 处 理 ,例如 算术 运算 或 逻辑 运算 。 男 外 ,指令 的 执行 还 可 以 
是 对 其 他 指令 的 控制 过 程 。 

一 条 指令 的 执行 可 以 是 上 述 几 种 情况 的 组 合 。 

另外 ,在 指令 的 执行 过 程 中 或 一 条 指令 执行 结束 时 ,尽管 指令 地 址 计数 器 中 已 指明 了 下 
一 条 被 访问 指令 的 地 址 ,但 是 ,外 部 设备 或 计算 机 内 部 可 能 会 发 来 吸 须 处 理 的 数据 或 其 他 紧 
急事 件 处 理 信号 。 这 就 需要 处 理 机 暂停 正在 执行 的 程序 , 转 去 处 理 相 应 的 紧急 事件 , 待 处 理 
完毕 后 再 返回 原 处 继续 执行 ,这 一 过 程 称 为 中 断 , 如 图 1.9 所 示 。 


用 户 程序 
指 Ai 有 
ee 中 断 | 处理 程序 
6 -| -和 | 前 后 令 《各 
图 1.8 指令 的 执行 周期 图 1.9 中 断 的 执行 过 各 


中 断 给 操作 系统 设计 带 来 许多 好 处 ,首先 使 得 实时 处 理 许多 紧急 事件 成 为 可 能 ;其 次 
中 断 可 以 增加 处 理 机 的 执行 效率 ;另外 ,中 断 还 可 以 简化 操作 系统 的 程序 设计 。 
具有 中 断 处 理 时 的 指令 执行 过 程 如 图 1. 10 所 示 。 


读 入 中 断 
处 理 指令 

N 
二 读 入 下 | .| 执行 Y_| 检查 
人 /| 一 条 指令 | “| 当前 指令 中 断 位 


结束 
图 1.10 中 断 处 理 时 的 指令 执行 过 程 


系统 发 生 中 断 时 ,处 理 机 收 到 中 断 信号 ,从 而 不 能 继续 执行 程序 计数 器 中 所 指 的 原 程 
序 。 这 时 处 理 机 将 保存 当前 的 执行 现场 (也 就 是 各 寄存 器 中 的 值 ) 并 调用 新 的 程序 到 处 理 机 
上 执行 。 

1.5.5 操作 系统 的 启动 


操作 系统 负责 管理 计算 机 软 硬 件 资源 。 可 是 ,操作 系统 本 身 也 是 一 种 资源 。 在 计算 机 
系统 中 ,操作 系统 是 如 何 启 动 运 行 的 呢 ? 
事实 上 , 当 用 户 启动 计算 机 的 电源 时 ,计算 机 硬件 会 自动 产生 一 个 中 断 信号 ,这 个 中 断 
冒号 触发 计算 机 处 理 器 (CPU) 中 的 一 段 指 令 执 行 。 该 段 指令 的 执行 结果 将 是 发 现 外 部 存 
储 设备 中 操作 系统 引导 区 (boot block) 的 位 置 。 如 果 计 算 机 的 外 部 存储 设备 中 已 经 安装 了 
操作 系统 , 则 操作 系统 引导 区 中 的 代码 将 被 自动 导 和 人 计算 机 的 内 存 , 并 开始 执行 。 引 导 区 代 
码 的 执行 结果 是 将 操作 系统 程序 加 载 到 计算 机 内 存 中 的 指定 区 域 ,并 初始 化 计算 机 的 有 关 
硬件 ,例如 寄存 器 终端 设备 ,以 及 各 种 计算 机 运行 所 需要 的 数据 结构 等 。 至 此 ,操作 系统 程 
序 开 始 启动 ,并 为 用 户 提供 相应 的 用 户 界面 ,开始 提供 用 户 所 需要 的 各 种 服务 。 


1.6 算法 的 描述 


操作 系统 设计 和 原理 描述 中 涉及 许多 算法 。 一 般 来 说 ,这 些 算法 可 以 用 自然 语言 或 流 
程 图 方式 描述 。 有 许多 书 中 也 用 类 Pascal 语言 或 其 他 形式 描述 语言 来 描述 算法 。 为 了 描 
述 简单 起 见 , 本 书 定义 下 述 关键 词 描述 算法 中 的 有 关 过 程 。 

begin 


end 
分 别 表 示 算 法 的 开头 和 结束 。 
repeat 
操作 
until 条 件 


表示 当 条 件 未 被 满足 时 重复 所 描述 的 操作 。 
二 


while 条 件 
do 

操作 
od 


表示 当 条 件 满足 时 ,进行 相应 的 操作 。 关 键 词 do 和 od 分 别 表示 操作 的 开始 和 结束 。 
if 条 件 


then 
操作 
else 
操作 
天 
表示 满足 if 所 指定 的 条 件 时 ,进行 then 后 的 相关 操作 ,否则 完成 else 后 的 相关 操作 。 关 键 
词 fi 表示 条 件 判断 的 结束 。 
例如 ,图 1.8 所 示 的 指令 执行 周期 可 被 描述 为 


repeat IR<-MI[PC]; 
PC<—PC+1; 
execute [IR]; 

until CPU halt; 


其 中 ,MLPC] 表 示 地 址 为 PC 的 内 存单 元 中 的 指令 内 容 。 
另 一 个 例子 如 下 : 
令 pl1: 四 为 1 到 ?0z1) 的 整数 置换 。 
设 i=1,2,3,4,5,6,7; 
PL]=4, 7 LG 
描述 p[ 悦 的 巡回 置换 算法 。( 巡 回 置 换 指 kEL[1: nj 时 ,k= 二 pLp[L…p[kj…]] 的 置换 。) 
解 : 


begin 
local ky 
k=—1» 
while k<=7 do 
Kk? 
repeat print (x); 
Xp[x]; 
until x=k; 
Kok+ 1 
od 
end 


1.7 研究 操作 系统 的 几 种 观点 


上 面 各 节 讨 论 了 几 种 操作 系统 的 基本 概念 .操作 系统 发 展 的 历史 、 操 作 系 统 的 分 类 和 功 
能 以 及 操作 系统 所 依赖 的 硬件 基础 等 问题 ,使 我 们 认识 到 ,操作 系统 是 计算 机 资源 有 效 使 用 
。]17 。 


的 管理 者 和 为 用 户 提供 的 友好 接口 。 这 实质 上 代表 了 讨论 操作 系统 的 一 种 观点 。 

本 节 简 单 地 讨论 操作 系统 研究 中 的 不 同 观 点 ,这 些 观 点 彼此 并 不 矛盾 ,只 不 过 代表 了 对 
同一 事物 (操作 系统 ) 站 在 不 同 的 角度 来 看 待 的 结论 。 每 一 种 观点 都 有 助 于 理解 .分 析 和 设 
计 操 作 系统 。 


1.7.1 计算 机 资源 管理 者 的 观点 


前 面 已 经 指出 ,操作 系统 就 是 指 用 来 管理 和 控制 计算 机 系统 软 硬 资源 的 程序 的 集合 , 因 
此 它 提 供 了 处 理 机 管理 ,存储 管理 .设备 管理 和 信息 文件 管理 等 功能 。 对 于 每 种 资源 的 管理 
都 可 以 从 资源 情况 记录 ,资源 分 配 策略 .资源 分 配 和 资源 回收 等 几 个 方面 来 加 以 讨论 。 


1.7.2 用 户 界 面 的 观点 


对 于 用 户 来 说 ,对 操作 系统 的 内 部 结构 并 没有 多 大 的 兴趣 ,他 们 最 关心 的 是 如 何 利用 操 
作 系 统 提供 的 服务 来 有 效 地 使 用 计算 机 。 因 此 操作 系统 提供 了 什么 样 的 用 户 界 面 成 为 关键 
问题 , 即 1.4.5 节 中 所 提出 的 程序 一 级 和 作业 一 级 的 两 种 接口 。 


1.7.3 进程 管理 的 观点 


上 述 两 种 实际 上 是 静态 的 观点 ,没有 揭示 一 个 程序 在 系统 中 运行 的 本 质 过 程 和 管理 资 
源 的 各 种 子 程序 存在 的 关系 。 实 质 上 操作 系统 调用 当前 程序 运行 是 一 个 动态 过 程 ,特别 是 
现代 操作 系统 的 一 个 重要 特征 是 并 发 性 。 并 发 性 是 指 操作 系统 控制 很 多 能 并 发 执行 的 程序 
段 。 当 然 这 些 并 发 执行 的 程序 在 多 处 理 机 系统 中 可 能 是 真正 并 行 执行 的 ,但 在 单 处 理 机 情 
况 下 则 是 宕 观 并 行 .微观 顺 序 执行 的 。 它 们 可 以 是 完全 独立 地 运行 的 ,也 可 能 以 间接 或 直接 
方式 互相 依赖 和 制约 。 间 接 式 制约 是 指 并 发 程序 段 竞 争 同 一 资源 ,获得 者 执行 ,未 获得 者 挂 
起 ,等待 资 源 ;直接 式 制 约 是 指 一 个 程序 段 等 待 另 一 程序 段 执行 的 信息 结果 后 才能 执行 。 因 
此 并 发 的 程序 段 不 仅 会 受到 其 他 程序 段 活 动 的 制约 ,也 会 受到 系统 资源 分 配 情况 的 制约 。 
一 个 程序 段 可 能 在 运行 ,也 可 能 因 等 待 某 些 资源 或 信息 处 于 挂 起 状态 等 。 因 此 只 用 “操作 系 
统 是 资源 管理 程序 ”这 一 概念 不 能 揭示 它们 在 系统 中 活动 联系 及 其 状态 变化 ,从 而 引入 “ 进 
程 ”(process) 的 概念 ,有 时 也 称 为 “任务 ”(task) 或 “活动 ”*(active)。 所 谓 “ 进 程 ” 是 指 并 发 程 
序 的 执行 。 

用 进程 观点 来 研究 操作 系统 就 是 围绕 进程 运行 过 程 ( 即 并 发 程序 执行 过 程 ) 来 讨论 操作 
系统 ,就 能 讨论 清楚 “这 些 资源 管理 程序 在 系统 中 进行 活动 的 过 程 ”, 对 操作 系统 功能 就 能 获 
得 更 多 的 认识 。 


本 章 小 结 


计算 机 系统 由 硬件 和 软件 组 成 。 操 作 系 统 是 计算 机 系统 中 的 系统 软件 ,是 管理 和 控制 
计算 机 硬件 和 软件 资源 ,合理 组 织 计 算 机 工作 流程 ,以 便 有 效 利用 这 些 资 源 为 用 户 提 供 一 个 
具有 足够 的 功能 、 使 用 方便 、 可 扩展 、 安 全 和 可 管理 的 工作 环境 ,从 而 在 计算 机 与 其 用 户 之 间 
起 到 接口 的 作用 。 
随 着 计算 机 的 发 展 ,操作 系统 经 历 了 从 手工 操作 到 通用 操作 系统 的 发 展 历程 。 批 处 理 
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操作 系统 的 主要 特征 是 用 户 可 脱 机 使 用 计算 机 成 批 处 理 及 多 道 程序 运行 ,其 优点 是 共享 系 
统 资源 .系统 资源 利用 率 和 作业 吞吐 量 高 ,缺点 是 无 交互 性 .作业 周转 时 间 长 。 分 时 系统 采 
用 时 间 片 轮转 方式 使 一 台 计 算 机 为 多 个 终端 用 户 服务 ,具有 交互 性 .多 用 户 同时 性 和 独立 性 
等 特征 。 实 时 系统 应 用 于 实时 控制 和 实时 信息 处 理 领 域 ,完成 对 信息 及 时 地 分 析 和 处 理 ,其 
主要 特点 是 即时 响应 和 高 可 靠 性 。 通 用 操作 系统 可 以 同时 兼 有 批 处 理 、 分 时 、 实 时 处 理 和 多 
重 处 理 的 功能 ,或 其 中 两 种 以 上 的 功能 。 个 人 计算 机 上 的 操作 系统 是 联机 的 交互 式 单 用 户 
操作 系统 , 随 着 多 媒体 技术 的 应 用 ,个 人 计算 机 操作 系统 越 来 越 要 求 成 为 具有 高 速 数 据 处 理 
能 力 的 实时 多 任务 操作 系统 。 网 络 操作 系统 是 通过 计算 机 网 络 将 多 个 计算 机 系统 互联 , 实 
现 信息 交换 、 资 源 共享 、 可 互 操 作 和 协作 处 理 的 系统 。 分 布 式 操作 系统 是 通过 通信 网 络 将 物 
理 上 分 布 的 具有 自治 功能 的 数据 处 理 系 统 或 计算 机 系统 互联 、 实 现 信 息 交 换 和 资源 共享 、 协 
作 完 成 任务 的 系统 。 以 上 这 些 都 是 操作 系统 的 基本 类 型 。 

操作 系统 的 基本 功能 包括 处 理 机 管理 ,存储 管理 .设备 管理 ,信息 管理 以 及 用 户 接口 。 
这 些 基 本 功能 的 目标 是 管理 和 控制 计算 机 系统 所 有 软 硬 件 资源 ,为 用 户 提供 一 个 良好 的 工 
作 环 境 和 友好 的 接口 。 计 算 机 最 基本 的 功能 是 执行 指令 ,指令 的 执行 涉及 处 理 机 与 内 存 之 
间 的 数据 传输 或 处 理 机 与 外 部 设备 之 间 的 数据 传输 。 指 令 执行 过 程 中 , 若 外 部 设备 或 计算 
机 内 部 发 来 吸 须 处 理 的 数据 或 其 他 紧急 事件 处 理 信号 时 ,系统 将 进入 中 断 处 理 过 程 。 中 断 
时 处 理 机 将 保存 当前 的 执行 现场 ,并 调用 新 的 程序 到 处 理 机 上 执行 。 

对 操作 系统 的 研究 有 不 同 的 观点 ,如 操作 系统 是 计算 机 资源 管理 者 的 观点 、 用 户 界 面 的 
观点 以 及 进程 管理 的 观点 等 ,这 些 观点 代表 对 操作 系统 不 同 角度 的 看 法 ,都 有 助 于 理解 、 分 
析 和 设计 操作 系统 。 


习 题 


什么 是 操作 系统 的 基本 功能 ? 

什么 是 批 处 理 .分 时 和 实时 系统 ? 它们 各 有 什么 特征 ? 

多 道 程序 设计 (multiprogramming) 和 多 重 处 理 (multiprocessing) 有 何 区 别 ? 
讨论 操作 系统 可 以 从 哪些 角度 出 发 ,如 何 把 它们 统一 起 来 。 

写 出 1.6 节 中 巡回 置换 算法 的 执行 结果 。 

设计 计算 机 操作 系统 时 与 哪些 硬件 器 件 有 关 ? 


天 天 天 二 二 一 
GD OO 上 已 靖 


第 2 章 操作 系统 用 户 界面 


本 章 主要 从 用 户 使 用 和 系统 管理 两 方面 出 发 ,讨论 操作 系统 为 用 户 提供 的 编程 接口 和 
命令 控制 接口 。 首 先 讨 论 操 作 系统 的 管理 概念 ,然后 介绍 系统 调用 与 编程 接口 ,最 后 介绍 操 
作 系 统 用 户 界面 示例 。 


2.1 简 介 


用 户 界面 是 操作 系统 的 重要 组 成 部 分 。 用 户 界面 负责 用 户 和 操作 系统 之 间 的 交互 。 即 
用 户 通过 用 户 界面 向 计算 机 系统 提交 服务 需求 ,计算 机 通过 用 户 界面 向 用 户 提 供用 户 所 需 
要 的 服务 。 

一 般 来 说 ,计算 机 系统 的 用 户 有 两 类 。 

一 类 是 使 用 和 管理 计算 机 应 用 程序 的 用 户 ,也 就 是 被 服务 者 。 这 类 用 户 又 可 进一步 分 
为 普通 用 户 和 管理 员 用 户 。 其 中 普通 用 户 只 是 使 用 计算 机 的 应 用 服务 ,以 解决 实际 的 应 用 
问题 ,例如 事务 处 理 、 过 程控 制 等 。 管理 员 用 户 则 负责 计算 机 和 操作 系统 的 正常 与 安全 
运行 。 

另 一 类 用 户 是 程序 开发 人 员 。 程 序 开发 人 员 需 要 使 用 操作 系统 所 提供 的 编程 功能 开发 
新 的 应 用 程序 ,完成 用 户 所 要 求 的 服务 。 

操作 系统 为 普通 用 户 ,管理 员 用 户 以 及 编程 人 员 提 供 不 同 的 用 户 界面 。 

操作 系统 为 普通 用 户 和 管理 员 用 户 提 供 的 界面 由 一 组 以 不 同形 式 表示 的 操作 命令 组 
成 。 其 中 ,每 个 命令 实现 和 完成 用 户 所 要 求 的 特定 功能 和 服务 ,例如 上 网 、 在 线 处 理 和 办 公 

不 同 计算 机 操作 系统 为 用 户 提供 的 用 户 操 作 命 令 和 表现 形式 不 同 , 不 同时 期 的 操作 系 
统 为 用 户 提供 的 操作 命令 和 表现 形式 也 不 同 。 例 如 , Windows 系统 、UNIX 和 Linux 提供 
给 用 户 的 操作 命令 都 是 不 同 的 。 

再 者 ,同一 操作 系统 为 普通 用 户 与 管理 员 用 户 提供 的 命令 集合 也 是 不 一 样 的 。 读 者 可 
以 自己 考察 UNIX 系统 或 Linux 系统 中 管理 员 用 命令 集 与 普通 用 户 命令 集 的 区 别 。 

操作 系统 的 操作 命令 界面 称 为 命令 控制 界面 。 

另外 ,操作 系统 为 编程 人 员 提供 的 界面 是 系统 调用 。 系 统 调用 是 操作 系统 为 编程 人 员 
提供 的 唯一 界面 。 不 同 的 操作 系统 为 编程 人 员 提 供 的 系统 调用 不 同 。 

综 上 所 述 ,针对 不 同 的 用 户 ,操作 系统 提供 不 同 的 用 户 界面 ,其 中 普通 用 户 和 管理 员 用 
户 的 界面 是 一 组 不 同 操作 命令 的 集合 ,它们 分 别 实现 用 户 所 要 求 的 不 同 功能 ,为 用 户 提供 相 
应 的 服务 ;对 编程 人 员 提 供 的 是 一 组 系统 调用 的 集合 ,这 些 系统 调用 允许 编程 人 员 使 用 操作 
系统 和 程序 ,开发 能 够 满足 用 户 服务 需求 的 新 的 控制 命令 。 
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2.2 一 般 用 户 的 输入 输出 界面 


要 了 解 计算 机 是 怎样 和 用 户 交 互 的 ,就 必须 了 解 用 户 怎样 使 用 计算 机 提供 的 各 种 命令 
以 及 学 会 怎样 把 编制 的 应 用 程序 变 成 普通 用 户 可 以 使 用 的 命令 。 

在 操作 系统 中 ,作业 (job) 或 任务 (task) 是 一 个 常见 的 概念 。 在 PC 等 微机 系统 中 ,作业 
的 概念 有 助 于 人 们 对 问题 的 认识 和 管理 。 


2.2.1 作业 的 定义 


回忆 一 下 一 般 的 编程 过 程 ,编制 一 个 应 用 程序 大 致 要 经 过 图 2. 1 所 描述 的 步骤 。 即 由 
概念 或 构思 出 发 ,经 过 功能 设计 、 结 构 设计 以 及 详细 设计 过 程 之 后 ,再 编制 程序 和 进行 编辑 
输入 ,编译 链接 和 反复 调试 之 后 再 形成 执行 代码 并 执行 ,然后 输出 执行 结果 和 建立 相应 的 广 
档 等 。 

需求 分 析 


概念 功能 |_ | 结构 | | 详细 |_ .| 编辑 
设计 厂 ” 设 计 厂 ” 设 计 站 “| 输入 


建 档 王 一 输出 | 一 一 执行 一 一 链接 | 一 一 编译 | 一 一 | 调试 


图 2.1 一 般 的 编程 过 程 


在 图 2. 1 中 ,直到 编辑 为 止 的 各 步 都 认为 是 由 人 工 独立 完成 的 (尽管 也 有 许多 支撑 软件 
存在 ), 但 从 编辑 输入 开始 的 以 下 各 步 却 是 在 用 户 的 控制 下 由 计算 机 完成 。 

在 一 次 应 用 业务 处 理 过 程 中 ,从 输入 开始 到 输出 结束 ,用 户 要 求 计算 机 所 做 的 有 关 该 次 
业务 处 理 的 全 部 工作 称 为 一 个 作业 。 作 业 由 不 同 的 顺序 相连 的 作业 步 组 成 。 作 业 步 是 在 一 
个 作业 的 处 理 过 程 中 计算 机 所 做 的 相对 独立 的 工作 。 一 般 来 说 ,每 一 个 作业 步 产 生 下 一 个 
作业 步 的 输入 文件 。 例 如 ,在 图 2. 1 中 ,编辑 输入 是 一 个 作业 步 , 它 产生 源 程序 文件 ;编译 也 
是 一 个 作业 步 , 它 产生 目标 代码 文件 。 

从 系统 的 角度 看 ,作业 则 是 一 个 比 程序 更 广 的 概念 , 它 由 程序 、 数 据 和 作业 说 明 书 组 成 。 
系统 通过 作业 说 明 书 控制 文件 形式 的 程序 和 数据 ,使 之 执行 和 操作 。 而 且 , 在 批 处 理 系统 
中 ,作业 是 抢占 内 存 的 基本 单位 ,也 就 是 说 , 批 处 理 系统 以 作业 为 单位 把 程序 和 数据 调 人 内 
存 以 便 执行 。 

需要 说 明 的 是 ,作业 的 概念 一 般 用 于 早期 批 处 理 系统 和 现在 的 大 型 机 、 巨 型 机 系统 中 ， 
对 于 广 为 流 行 的 微机 和 工作 站 系统 ,一般 不 使 用 作业 的 概念 。 


2.2.2 作业 组 织 


如 上 所 述 , 作 业 由 3 部 分 组 成 , 即 程 序数 据 和 作业 说 明 书 。 一 个 作业 可 以 包含 多 个 程 

序 和 多 个 数据 集 , 但 必须 至 少 包 含 一 个 程序 ,否则 将 不 成 为 作业 。 作 业 中 包含 的 程序 和 数据 

完成 用 户 所 要 求 的 业务 处 理工 作 。 作 业 说 明 书 则 体现 用 户 的 控制 意图 ,由 作业 说 明 书 在 系 
sa 2 = 


统 中 生成 一 个 称 为 作业 控制 块 (Job Control Block,JCB) 的 表格 。 该 表格 登记 该 作业 所 要 求 

的 资源 情况 、 预 计 执行 时 间 和 执行 优先 级 等 。 从 户 名 

而 ,操作 系统 通过 该 表 了 解 到 作业 要 求 ,并 分 配 资 < 六 
作业 基本 情况 描述 


Ss a | 使 用 的 编程 语言 名 
we id 
行 等。 i 


作业 说 明 书 主要 包含 3 方面 内 容 , 即 作业 的 控制 方式 
基本 描述 .作业 控制 描述 和 资源 要 求 描述 。 作 业 rami < 0 
基本 描述 包括 用 户 名 、 作 业 名 ,使 用 的 编程 语言 
以 及 允许 的 最 大 处 理 时 间 等 。 而 作业 控制 描述 则 要 求 处 理 时 间 
大 致 包 括 作 业 在 执行 过 程 中 的 控制 方式 ,例如 是 内 存 大 小 
脱 机 控制 还 是 联机 控制 ,各 作业 步 的 操作 顺序 以 ”作业 资源 要 求 描述 < 分 误 丙 作 冯 


及 作业 不 能 正常 执行 时 的 处 理 等 。 资 源 要 求 描述 这 函数 或 实用 程 请 
包括 要 求 内 存 大 小 .外 设 种 类 和 人 台数 .处 理 机 优先 
级 .所 需 处 理 时 间 、 所 需 库 函数 或 实用 程序 等 。 作 
业 说 明 书 的 主要 内 容 如 图 2.2 所 示 。 

一 般 来 说 ,作业 说 明 书 方式 主要 用 在 批 处 理 系统 中 , 且 各 计算 机 厂家 都 对 自己 的 系统 定 
义 有 各 自 的 作业 说 明 书 的 格式 和 内 容 。 因 此 ,上 述 作 业 说 明 书 的 内 容 因 计算 机 厂家 而 异 。 
不 过 ,无 论 何 种 作业 说 明 书 ,都 根据 系统 提供 的 控制 命令 和 有 关 参 数 按照 一 定 的 格式 进行 
编写 。 

另外 ,在 微机 系统 和 工作 站 系统 中 ,常用 批 处 理 文件 或 shell 程序 方式 编写 作业 说 明 书 。 


2.2.3 一 般 用 户 的 输入 输出 方式 


输入 输出 方式 可 分 为 5 种 , 即 联机 输入 输出 方式 、. 脱 机 输入 输出 方式 直接 耦合 方式 、 
spooling(simultaneous peripheral operations on-line) 系 统 和 网 络 联 机 方式 。 

1. 联机 输入 输出 方式 

联机 输入 方式 大 多 用 在 交互 式 系统 中 ,用 户 和 系统 通过 交互 会 话 来 输入 输出 作业 。 在 
联机 方式 中 ,外 围 设 备 直接 和 主机 相连 接 , 一 台 主 机 可 以 连接 一 台 或 多 台 外 围 设备 ,这 些 设 
备 可 以 是 键盘 、 鼠 标 、 显 示 器 或 光电 笔 、 打 印 机 等 。 

2. 脱 机 输入 输出 方式 

脱 机 输入 又 称 为 预 输入 方式 。 脱 机 输入 输出 方式 主要 是 为 了 解决 设备 联机 输入 输出 时 
速度 太 慢 的 问题 。 脱 机 输入 输出 方式 利用 个 人 计算 机 作为 外 围 处 理 机 进行 输入 输出 处 理 。 
在 个 人 机 上 ,用 户 通过 联机 方式 把 数据 或 程序 首先 输入 到 后 援 存储 器 上 ,例如 优盘 等 ;然后 ， 
用 户 把 装 有 输入 数据 的 后 援 存储 器 拿 到 主机 的 高 速 外 围 设备 上 和 主机 连接 ,从 而 在 较 短 的 
时 间 内 完成 作业 的 输入 工作 。 输 出 过 程 则 与 此 相反 。 

3. 直接 耦合 方式 

直接 耦合 方式 保留 了 脱 机 输入 输出 方式 快速 输入 的 优点 ,又 没有 脱 机 输入 输出 方式 人 
工 干 预 的 缺点 ,直接 耦合 方式 把 主机 和 外 围 机 通过 一 个 公用 的 大 容量 外 存 直 接 耦 合 起 来 
从 而 省 去 了 在 脱 机 输入 中 依靠 人 工 干预 来 传递 后 援 存 储 器 的 过 程 。 在 直接 耦合 方式 中 , 慢 
速 的 输入 输出 过 程 仍 由 外 围 机 自己 管理 ,而 对 公用 存储 器 中 的 大 量 数据 的 高 速 读 写 则 由 


图 2.2 作业 说 明 书 的 主要 内 容 


主机 完成 。 直 接 耦 合 方式 的 原理 如 图 2. 3 所 示 。 


一 | 低档 PC 


主机 K 二 9 公用 存储 器 


一 | 低档 PC 
图 2.3 直接 耦合 方式 


直接 耦合 方式 需要 一 个 大 容量 的 公用 存储 器 ,把 多 台 外 围 机 、 主 机 和 公用 存储 器 固定 连 
接 起 来 。 

4. spooling 系统 

spooling 又 可 译作 外 围 设备 同时 联机 操作 。spooling 系统 的 工作 原理 如 图 2.4 所 示 。 


输入 装置 | 一 外 存 一 一 | 给 出 装 轩 
通 | 通 
道 | | FE] | 首 
输入 装置 | 一 | 和 | 输出 装置 
输入 井 输出 


输入 管理 | 输出 管理 
模块 模块 


主机 系统 


图 2.4 spooling 系统 


在 spooling 系统 中 ,多 台 外 围 设备 通过 通道 或 DMA 器 件 和 主机 与 外 存 连 接 起 来 。 作 
业 的 输入 输出 过 程 由 主机 中 的 操作 系统 控制 。 操 作 系 统 中 的 输入 程序 包含 两 个 独立 的 过 
程 ,一 个 过 程 负责 从 外 部 设备 把 信息 读 人 缓冲 区 ; 另 一 个 是 写 过 程 , 负 责 把 缓冲 区 的 信息 送 
到 外 存 输入 井中 。 这 里 ,外围 设备 既 可 以 是 各 种 终端 ,也 可 以 是 其 他 的 输入 设备 ,例如 纸 带 
输入 机 或 读 卡 机 等 。 

有 关 通 道 和 DMA 的 概念 ,已 在 计算 机 原理 课 中 讲述 了 。 通 道 是 一 个 独立 于 CPU 的 专 
管 输入 输出 的 处 理 机 , 它 控 制 外 设 或 外 存 与 内 存 之 间 的 信息 交换 。 它 有 自己 的 通道 指令 ,以 
驱动 外 设 进行 读 写 操作 。 不 过 ,这 些 指令 需要 CPU 执行 相应 的 “启动 通道 ”指令 发 来 启动 
信号 之 后 才 开始 执行 。DMA 方 式 类 似 于 通道 方式 。 与 通道 不 同 的 是 ,在 DMA 方式 中 , 信 
息 的 传送 方向 、 信 息 传 送 的 源 地 址 和 目的 地 址 以 及 传送 长 度 等 都 是 由 CPU 控制 而 不 是 由 
DMA 器 件 控制 的 。 有 关 通 道 和 DMA 控制 方式 ,还 将 在 第 9 章 中 讨论 。 

spooling 系统 的 输入 方式 既 不 同 于 脱 机 方式 ,也 不 同 于 直接 耦合 方式 。 在 系统 输入 模 
块 收 到 作业 输入 请 求 信号 后 ,输入 管理 模块 中 的 读 过 程 负责 将 信息 从 输入 装置 读 入 缓冲 区 。 
当 缓 冲 区 满 时 ,由 写 过 程 将 信息 从 缓冲 区 写 到 外 存 输入 井中 。 读 过 程 和 写 过 程 反复 循环 , 直 
到 一 个 作业 输入 完毕 。 当 读 过 程 读 到 一 个 硬件 结束 标志 之 后 ,系统 再 次 驱动 写 过 程 把 最 后 
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一 批 信息 写 和 人 外 存 并 调用 中 断 处 理 程序 结束 该 次 输入 。 然 后 ,系统 为 该 作业 建立 作业 控制 
块 (JCB), 从 而 使 输入 井中 的 作业 进入 作业 等 待 队列 ,等 待 作业 调度 程序 选中 后 进入 内 存 。 
5. 网 络 联机 方式 
网 络 联机 方式 以 上 述 几 种 输入 输出 方式 为 基础 。 当 用 户 通过 计算 机 网 络 中 的 某 一 台 设 
备 对 计算 机 网 络 中 的 另 一 台 主 机 进行 输入 输出 操作 时 ,就 构成 了 网 络 联机 方式 。 


2.3 命令 控制 界面 


如 前 所 述 ,操作 系统 为 用 户 提供 两 个 接口 。 一 个 是 系统 为 用 户 提 供 的 各 种 命令 接口 ,用 
户 利 用 这 些 操作 命令 来 组 织 和 控制 作业 的 执行 或 管理 计算 机 系统 ; 另 一 个 接口 是 系统 调用 ， 
编程 人 员 使 用 系统 调用 来 请 求 操 作 系统 提供 服务 ,例如 申请 和 释放 外 设 等 类 资源 .控制 程序 
的 执行 速度 等 。 操 作 系 统 的 命令 控制 界面 就 是 用 来 组 织 和 控制 作业 运行 的 。 

使 用 操作 命令 进行 作业 控制 的 主要 方式 有 两 种 , 即 脱 机 方式 和 联机 方式 。 所 谓 脱 机 方 
式 , 即 用 户 将 作业 的 执行 顺序 和 出 错 处 理 方法 一 并 以 作业 控制 说 明 书 或 命令 文件 的 方式 提 
交 给 系统 ,由 系统 按照 作业 说 明 书 或 命令 文件 中 所 规定 的 顺序 控制 作业 执行 。 在 执行 过 程 
中 ,用 户 无 法 干涉 ,只 能 等 待 作业 正常 执行 结束 或 出 错 停 止 之 后 查看 执行 结果 或 出 错 信息 ， 
以 便 修改 作业 内 容 或 控制 过 程 。 

脱 机 控制 方式 利用 作业 控制 语言 来 编写 表示 用 户 控制 意图 的 作业 控制 程序 ,也 就 是 作 
业 说 明 书 。 作 业 控 制 语 言 的 语句 就 是 作业 控制 命令 。 不 同 的 批 处 理 系统 提供 不 同 的 作业 控 
制 语言 。 

联机 控制 方式 不 同 于 脱 机 控制 方式 , 它 不 要 求 用 户 填写 作业 说 明 书 ,系统 只 为 用 户 提供 
一 组 通过 键盘 或 其 他 操作 方式 输入 的 命令 。 用 户 使 用 系统 提供 的 操作 命令 和 系统 会 话 , 交 
互 地 控制 程序 执行 和 管理 计算 机 系统 。 其 工作 过 程 是 ,用 户 在 系统 给 出 的 提示 符 下 输入 特 
定 的 命令 ,系统 在 执行 完 该 命令 后 向 用 户 报告 执行 结果 ;然后 ,用 户 决 定 下 一 步 的 操作 。 如 
此 反复 ,直到 作业 执行 结束 。 凡 是 使 用 过 DOS、Windows 或 Linux 系统 的 读者 ,对 联机 控制 
方式 都 应 该 是 不 陌生 的 。 

与 脱 机 控制 方式 相 比 ,联机 控制 方式 的 命令 种 类 要 丰富 得 多 。 这 些 命令 可 大 致 分 为 以 
下 几 类 : 

(1) 环境 设置 。 这 些 命令 用 来 改变 终端 用 户 的 所 在 位 置 、 执 行路 径 等 。 

(2) 执行 权限 管理 。 这 些 命令 用 来 控制 用 户 访问 系统 和 读 、 写 .执行 有 关 文 件 的 权限 。 
例如 ,用 户 只 有 在 其 口令 经 过 系统 核准 之 后 才能 进入 系统 。 

(3) 系统 管理 。 该 类 命令 主要 用 于 系统 维护 、 开 机 与 关机 、 增 加 或 减少 终端 用 户 、 计 时 
收费 等 。 该 类 命令 是 操作 系统 提供 的 最 为 丰富 的 一 类 命令 , 且 其 中 的 很 大 一 部 分 为 系统 管 
理 员 使 用 。 

(4) 文件 管理 。 该 类 命令 用 于 管理 和 控制 终端 用 户 的 文件 。 例 如 ,复制 、 移 动 或 删除 某 
个 文件 或 显示 文件 内 容 和 改变 文件 名 字 ,以 及 搜索 文件 中 的 特定 行 或 字符 等 。 

(5) 编辑 编译、 链接 装配 和 执行 编辑 命令 用 于 帮助 用 户 输入 用 户 文件 ,不 同 的 编辑 器 
具有 不 同 的 命令 集合 。 

这 些 命令 用 于 增加 、 删 除 输入 字符 或 字符 行 ,用 于 进行 插入 、 移 动 甚至 绘图 等 。 编 译 和 
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链接 装配 命令 则 把 用 户 输入 的 源 程序 文件 编译 成 目标 代码 文件 之 后 ,再 链接 成 可 执行 代码 
文件 。 执 行 命令 则 将 链接 后 的 可 执行 代码 文件 送 入 内 存 启动 执行 。 

(6) 通信 。 通 信 类 命令 在 单机 系统 中 用 于 进行 主机 和 远程 终端 之 间 的 呼叫 .连接 以 及 
断 开 等 ,从 而 在 主机 和 终端 之 间 建 立会 话 信道 。 在 网 络 系统 中 ,通信 命令 除了 用 于 进行 有 关 
信道 的 呼叫 .连接 和 断 开 等 之 外 ,还 进行 主机 和 主机 之 间 的 信息 发 送 与 接收 显示、 编辑 等 
工作 。 

(7) 资源 要 求 。 用 户 使 用 该 类 命令 向 系统 申请 资源 ,例如 申请 某 台 外 围 设备 等 。 

联机 控制 方式 使 用 户 直 接 参 与 控制 作业 执行 ,因而 大 大 地 方便 了 用 户 。 但 是 ,在 某 些 情 
况 下 ,用户 反复 输入 众多 的 命令 也 会 感到 非常 烦琐 或 浪费 了 许多 不 必要 的 时 间 。 例 如 ,在 对 
某 个 源 代码 文件 进行 编译 调试 之 后 ,需要 重新 和 多 个 目标 代码 文件 链接 。 如 果 这 个 调试 和 
链接 不 是 一 次 成 功 的 话 ( 很 多 情况 下 是 不 可 能 的 ) ,那么 ,用 户 的 控制 过 程 将 会 非常 单调 和 烦 
琐 。 显 然 , 在 这 种 情况 下 , 批 处 理 方式 要 优 于 联机 控制 方式 。 因 此 ,在 现代 操作 系统 中 ,大 都 
提供 批 处 理 方式 和 联机 控制 方式 。 这 里 , 批 处 理 方式 既 指 传统 的 作业 控制 语言 编写 的 作业 
说 明 书 方式 ,也 指 那些 把 不 同 的 交互 命令 按 一 定格 式 组 合 后 的 命令 文件 方式 。 

近年 来 ,命令 控制 界面 的 人 机 交互 方式 发 生 了 革命 性 变化 。 一 个 操作 系统 命令 控制 界 
面 的 好 坏 成 了 决定 该 系统 是 否 能 受到 欢迎 的 重要 因素 。 例 如 ,无 论 是 Windows 系列 还 是 
Linux 系列 的 操作 系统 ,它们 的 命令 控制 界面 都 是 由 多 窗口 的 按钮 式 图 形 界面 组 成 的 。 在 
这 些 系 统 中 ,命令 已 被 开发 成 一 条 条 能 用 鼠标 点 击 而 执行 的 简单 菜单 或 小 巧 图 标 。 而 且 , 用 
户 也 可 以 在 提示 符 的 提示 下 用 普通 字符 方式 输入 各 种 命令 。 最 近 , 用 声音 控制 的 命令 控制 
界面 也 已 逐步 被 开发 出 来 。 可 以 预计 ,计算 机 系统 的 命令 控制 界面 将 会 越 来 越 方便 和 越 来 
越 拟人 化 。 


2.4 Linux 与 Windows 的 命令 控制 界面 


现代 操作 系统 的 命令 控制 界面 都 在 朝 着 多 媒体 的 拟人 化 方向 发 展 , 即 一 般 用 户 的 输入 
输出 界面 都 在 朝 着 人 类 自身 的 交流 方式 允 近 。Linux 和 Windows 的 用 户 界面 就 是 这 些 系 
统 中 最 具 代 表 性 的 两 种 。 


2.4.1 Linux 的 命令 控制 界面 


Linux 的 最 大 特点 是 其 源 代码 的 免费 和 开放 ,而 且 为 普通 用 户 与 程序 员 提 供 通 用 的 标 
准 接口 与 界面 。 

Linux 的 命令 控制 都 是 用 图 形 化 的 窗口 系统 以 及 Shell 程序 进行 的 。 

Linux 的 图 形 化 窗口 系统 是 X Window。 图 2.5 是 一 个 Ubuntu 系统 的 窗口 界面 示例 ， 
这 是 基于 Linux 2. 6 内 核 版 本 的 操作 系统 。 读 者 也 可 以 从 装 有 Linux 操作 系统 的 个 人 计算 
机 中 找到 其 他 Linux 窗口 系统 用 户 界 面 的 例子 。 另 外 ,也 可 以 从 网 站 www. kde. org 和 
www. gnome. org 中 找到 Linux 用 户 界 面 的 相关 知识 。 

一 般 来 说 ,Linux 命令 主要 包括 以 下 几 类 : 

(1) 系统 维护 及 管理 命令 ,例如 date .setenv 等 。 

(2) 文件 操作 及 管理 命令 ,例如 ls \find 等 。 
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图 2.5 Ubuntu 系统 的 窗口 界面 示例 


(3) 进程 管理 命令 ,例如 kill、at 等 。 

(4) 磁盘 及 设备 管理 命令 ,例如 df、du、mount 等 。 
(5) 用 户 管 理 命令 ,例如 adduser、userdel 等 。 

(6) 文档 操作 命令 ,例如 csplit、sort 等 。 

(7) 网 络 通信 命令 ,例如 netstat \ifconfig 等 。 

(8) 程序 开发 命令 市 如 cc、link 等 。 

(9) X Window 管理 命令 ,例如 startx、XE86Setup 等 


用 户 通 常会 


使 用 到 的 命令 大 多 放 在 /usr/sbin、 Jusr/bin, /sbin、/bin 目录 下 ,使 用 系统 


提供 的 man 命令 可 以 格式 化 并 显示 某 一 命令 的 联机 帮助 
Linux 交互 式 使 用 命令 或 允许 用 户 自己 编写 Shell 程序 以 采用 批 处 理 方 式 操作 。 
Linux Shell 是 一 种 交互 型 命令 解释 程序 ,也 是 一 种 命令 级 程序 设计 语言 解释 系统 , 它 


允许 用 户 编 制 


带 形式 参数 的 批 命令 文件 , 称 作 Shell 脚本 或 Shell 程序 。 在 Linux 下 ,可 以 


像 执 行 任何 其 他 命令 一 样 直接 输入 其 名 称 来 执行 一 个 Shell 程序 。 一 个 Shell 程序 由 以 下 


部 分 组 成 : 


。 命令 或 其 他 Shell 程序 ; 
。 位 置 参 数 ; 


变量 及 特殊 字符 ; 
表达 式 比较 ; 
控制 流 语句 ,例如 while、case 等 ; 


例如 ,把 目录 中 每 个 文件 在 一 个 子 目 录 中 建立 备份 的 Shell 程序 如 下 : 


mkdir backup 


s 二 


Enr File in Le" 
do 
cp $file backup/$ file 
if [$?-ne 0]; then 
echo "copying $file error" 
中 


done 


在 这 个 例子 中 ,首先 在 当前 目录 下 创建 了 一 个 子 目 录 backup, 然 后 在 其 中 循环 地 建立 
当前 目录 下 所 有 文件 的 备份 。 其 中 mkdir、cp、echo 等 是 Linux 命令 ,for 是 Shell 的 循环 语 
句 , $file 是 自 定义 变量 , $? 是 Shell 内 部 变量 ,-ne 是 Shell 的 表达 式 比较 操 作 符 。 

Linux Shell 可 定制 性 强 , 支 持 命令 广 , 具 有 良好 的 作业 控制 能 力 , 编 写 的 Shell 命令 又 
可 通过 脚本 的 形式 重新 组 合 使 用 ,完成 对 用 户 的 计算 环境 定制 等 ,功能 十 分 方便 。 但 Shell 
脚本 作为 一 种 解释 程序 ,执行 效率 低 , 操 作 粒 度 粗 , 不 适合 直接 操作 计算 机 的 存储 和 I/O 等 
设备 。 

Linux 窗口 系统 的 命令 操作 和 控制 非常 简单 ,它们 是 一 个 以 图 表 等 显示 的 命令 集合 ， 
户 可 以 用 鼠标 和 键盘 方便 地 和 系统 进行 交互 。 


2.4.2 Windows 的 命令 控制 界面 
Windows 视窗 系统 是 在 DOS、Windows 3. 2 等 基础 上 不 断 演 化 、 发 展 而 成 的 。 网 页 


http://www. microsoft. com/windows/WinHistoryIntro. mspx 上 详细 地 介绍 了 Windows 
用 户 界面 及 其 发 展 历 史 。 

Windows 的 命令 控制 界面 可 以 分 为 两 大 部 分 , 即 命令 解释 器 部 分 (相当 于 Linux 的 
Shell) 和 窗口 交互 部 分 。 

Windows 窗口 部 分 主要 是 利用 鼠标 或 键盘 ,通过 直观 的 方式 对 图 形 化 界面 进行 操作 ， 
这 里 不 再 详细 介绍 。 

Windows 通过 自 带 的 命令 行 解释 器 cmd. exe 为 用 户 提供 了 功能 强大 的 命令 行 控制 界 
面 ,用 户 可 以 通过 输入 命令 来 对 Windows 操作 系统 进行 控制 和 使 用 。 这 些 命 令 包 括 了 从 
MS-DOS 保留 下 来 的 一 些 基本 命令 以 及 Windows 自 有 的 操作 命令 ,主要 分 为 以 下 几 类 

(1) 系统 信息 命令 ,例如 Time、Date、Mem、Driverquery 和 SystemInfo 等 。 

(2) 系统 操作 命令 ,例如 Shutdown、Runas 和 Taskkill 等 。 

(3) 文件 系统 命令 ,例如 Copy、Del 和 Mkdir 等 。 

(4) 网 络 通信 命令 ,例如 Ping、Netstat 和 Route 等 。 

每 个 命令 有 不 同 的 功能 ,不 同 的 命令 可 以 按照 下 面 的 形式 进行 组 合 从 而 形成 新 的 命令 : 

Commandl & Command2: 用 来 分 隔 一 个 命令 行 中 的 多 个 命令 。 即 Cmd. exe 运行 第 
一 个 命令 ,然后 运行 第 二 个 命令 。 

Commandl &.&. Command2: 只 有 在 符号 && 前 面 的 命令 运行 成 功 时 , 才 运 行 符号 
&&&&. 后 面 的 命令 。 

Commandl || Command2: 只 有 在 符号 | | 前 面 的 命令 运行 失败 时 , 才 运 行 符号 | | 后 面 

fi 
2 


(CCommandl & Command2) : 用 户 分 组 或 散 套 多 个 命令 。 

Commandl parameterl;parameter2: 用 分 号 (;) 分 隔 命令 参数 。 

用 上 面 的 命令 或 者 命令 组 合 , 用 户 就 可 以 完成 需要 的 功能 。 在 使 用 时 ,通常 有 下 面 两 种 
方式 。 

(1) 直接 在 命令 行 输入 命令 

用 户 运行 cmd. exe, 进 入 命令 行 界面 ,在 命令 行 提示 符 下 输入 命令 。 例 如 : 


Systeminfo&mem 


显示 当前 系统 的 属性 和 配置 等 ,然后 显示 当前 内 存 的 使 用 情况 。 

(2) 使 用 批 处 理 文件 

批 处 理 文件 是 无 格式 的 文本 文件 , 它 包 含 一 条 或 多 条 命令 ,其 文件 扩展 名 为 . bat 或 
. cmd。 在 命令 提示 符 下 输入 批 处 理 文件 的 名 称 ,cmd. exe 就 会 按照 该 文件 中 各 个 命令 出 现 
的 顺序 来 逐个 运行 它们 。 例 如 ,用 户 在 当前 目录 下 新 建 一 个 批 处 理 文件 examl. bat, 其 内 容 
如 下 : 


@echo off 
mkdir test 
echo hello 


pause 


其 中 ,@ 表 示 不 显示 当前 命令 本 身 ,echo off 表示 后 面 的 命令 都 不 显示 ,mkdir test 表示 
在 当前 目录 下 新 建 一 个 test 文件 夹 ,echo hello 表示 打印 hello 字符 ,pause 表示 暂停 执行 ， 
等 待 用 户 响 应 。 

用 户 可 以 直接 用 鼠标 双击 examl. bat 的 图 标 执行 批 处 理 ,也 可 以 先 运行 cmd. exe, 在 命 
令 提 示 符 下 输入 examl 来 执行 批 处 理 , 脚 本 中 的 命令 将 顺序 执行 。 

批 处 理 文件 之 间 是 可 以 相互 调用 和 传递 参数 的 ,这 样 ,用户 就 可 以 将 单元 功能 模块 连接 
起 完成 更 为 复杂 的 功能 ,避免 了 用 户 手工 进行 功能 模块 命令 的 输入 。 例 如 ,在 当前 路 径 下 还 
有 两 个 批 处 理 文件 。 

exam2. bat 的 内 容 如 下 : 


Qecho off 
mem> %1/meminfo.txt 


echo generate memory info ok! 
exam3. bat 的 内 容 如 下 : 


Q@echo off 
type $1\* .txt 
echo type ok! 


其 中 ,%1 表示 第 一 个 输入 参数 ,exam2. bat 的 功能 是 将 系统 当前 的 内 存 使 用 情况 保存 
到 以 输入 参数 1 为 名 字 的 文件 夹 下 的 meminfo. txt 文件 中 ,如 果 meminfo. txt 不 存在 , 则 进 
行 创建 ;exam3. bat 的 功能 是 将 以 输入 参数 1 为 名 字 的 文件 夹 下 的 所 有 txt 文件 的 内 容 打印 
出 来 。 
。 28 。 


将 前 面 的 examl. bat 进行 改写 : 


@echo off 

mkdir test 

Call exam2 .bat test 
Call exam3 .bat test 
echo call ok! 


pause 
这 样 ,在 examl. bat 中 对 exam2 和 exam3 进行 了 调用 ,使 用 test 文件 夹 下 的 meminfo 
. txt, 其 中 保存 了 系统 当前 的 内 存 使 用 情况 ,在 屏幕 上 将 其 内 容 打 印 出 来 。 
用 鼠标 双击 examl. bat 的 图 标 或 者 在 命令 行 模式 下 运行 examl. bat, 运 行 结 果 如 图 2.6 
所 示 。 运 行 结束 后 ,在 当前 文件 夹 下 新 建 了 test 文件 夹 , 其 下 有 meminfo. txt 文件 ,存放 的 
文本 是 系统 当前 的 内 存 使 用 信息 。 
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图 2.6 相互 调用 批 处 理 示 例 


2.5 系统 调用 


系统 调用 是 操作 系统 提供 给 编程 人 员 的 唯一 接口 。 编 程 人 员 利 用 系统 调用 ,在 源 程 序 
一 级 动态 请 求 和 释放 系统 资源 ,调用 系统 中 已 有 的 系统 功能 来 完成 那些 与 计算 机 硬件 部 分 
相关 的 工作 以 及 控制 程序 的 执行 速度 等 。 因 此 ,系统 调用 像 一 个 黑箱 子 那样 ,对 用 户 屏 蔽 了 
操作 系统 的 具体 动作 而 只 提供 有 关 的 功能 。 事 实 上 ,命令 控制 界面 也 是 在 系统 调用 的 基础 
上 开发 而 成 的 。 

系统 调用 大 致 可 分 为 如 下 几 类 : 

(1) 设备 管理 。 用 来 请 求 和 释放 有 关 设 备 以 及 启动 设备 操作 等 。 

(2) 文件 管理 。 包 括 对 文件 的 读 、 写 .创建 和 删除 等 。 

(3) 进程 控制 。 进 程 是 一 个 在 功能 上 独立 的 程序 的 一 次 执行 过 程 。 进 程控 制 的 有 关系 
统 调用 包括 进程 创建 进程 执行 进程 撤销 、 执 行 等 待 和 执行 优先 级 控制 等 。 

(4) 进程 通信 。 该 类 系统 调用 用 于 在 进程 之 间 传 递 消息 或 信和 号。 

(5) 存储 管理 。 包 括 调查 作业 占据 内 存 区 的 大 小 、 获 取 作 业 占 据 内 存 区 的 始 址 等 。 

(6) 线程 管理 。 包 括 线程 的 创建 .调度 .执行 和 撤销 等 。 
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不 同 的 系统 提供 不 同 的 系统 调用 。 一 般 , 每 个 系统 为 用 户 提供 几 十 到 几 百 条 系统 调用 。 

为 了 提供 系统 调用 功能 ,操作 系统 内 必须 有 事先 编制 好 的 实现 这 些 功能 的 子 程序 或 过 
程 。 同 时 ,为 了 保证 操作 系统 程序 不 被 用 户 程序 破坏 ,一 般 操作 系统 都 不 允许 用 户 程序 直接 
访问 操作 系统 的 系统 程序 和 数据 。 编 程 人 员 如 何 调用 操作 系统 内 部 的 程序 或 数据 ?这 需要 
有 一 个 类 似 于 硬件 中 断 的 处 理 机 制 。 当 用 户 使 用 系统 调用 时 ,产生 一 条 相应 的 指令 ,处 理 机 
在 执行 到 该 指令 时 发 生 相 应 的 中 断 ,并 发 出 有 关 信 号 给 该 处 理 机 制 。 该 处 理 机 制 在 收 到 了 
处 理 机 发 来 的 信号 后 ,启动 相关 的 处 理 程序 去 完成 该 系统 调用 所 要 求 的 功能 。 

在 系统 中 为 控制 系统 调用 服务 的 处 理 机 构 称 为 陷阱 (trap) 处 理 机 构 。 与 此 相对 应 ,把 
由 于 系统 调用 引起 处 理 机 中 断 的 指令 称 为 陷阱 指令 (或 称 访 管 指令 )。 在 操作 系统 中 ,每 个 
系统 调用 都 对 应 一 个 事先 给 定 的 功能 号 ,例如 0、1、2 和 3 等 。 在 陷阱 指令 中 必须 包括 对 应 
系统 调用 的 功能 号 。 而 且 , 在 有 些 陷 阱 指令 中 ,还 带 有 传递 给 陷阱 处 理 机 构 和 内 部 处 理 程序 
的 有 关 参 数 。 

为 了 实现 系统 调用 ,系统 设计 人 员 还 必须 为 实现 各 种 系统 调用 功能 的 子 程序 编制 人 口 
地 址 表 , 每 个 人 口 地 址 都 与 相应 的 系统 子 程序 名 对 应 起 来 。 然 后 ,由 陷阱 处 理 程序 把 陷阱 指 
令 中 所 包含 的 功能 号 与 该 入 口 地 址 表 中 的 有 关 项 对 应 起 来 ,从 而 由 系统 调用 功能 号 驱动 有 
关系 统 子 程序 执行 。 

由 于 在 系统 调用 处 理 结 束 之 后 ,用 户 程序 还 需 利 用 系统 调用 的 返回 结果 继续 执行 , 因 
此 ,在 进入 系统 调用 处 理 之 前 ,陷阱 处 理 机 构 还 需 保 存 处 理 机 现场 。 再 者 ,在 系统 调用 处 理 
结束 之 后 ,陷阱 处 理 机 构 还 要 恢复 处 理 机 现场 。 在 操作 系统 中 ,处理 机 的 现场 一 般 被 保护 在 
特定 的 内 存 区 或 寄存 器 中 。 系 统 调 用 的 处 理 过 程 如 图 2.7 所 示 。 


户 程序 陷阱 处 理 机 构 系统 子 程序 

Ao| subo 

号 v| | 0D 例外 理 | 个 中 表 
BY 机 现场 Ao Al subl 

(2) 取 系统 调 | [AL 

System call 和 全 : 
可 找 了 | ce l 
程序 入 口 洲 中 
(3) 返 区 


: 
> Aj| sub, 


图 2.7 系统 调用 的 处 理 过 程 


有 关系 统 调用 的 另 一 个 问题 是 参数 传递 问题 。 不 同 的 系统 调用 需要 传递 给 系统 子 程序 
以 不 同 的 参数 。 而 且 , 系 统 调 用 的 执行 结果 也 要 以 参数 形式 返回 给 用 户 程 序 。 那 么 ,怎样 实 
现 用户 程 序 和 系统 程序 之 间 的 参数 传递 呢 ? 下 面 介 绍 几 种 常用 的 实现 方法 。 一 种 是 由 陷阱 
指令 自 带 参数 。 一 般 来 说 ,一 条 陷阱 指令 的 长 度 总 是 有 限 的 ,而 且 , 该 指令 还 要 携带 一 个 系 
统 调用 的 功能 号 ,从 而 ,陷阱 指令 只 能 自 带 极 有 限 的 几 个 参数 进入 系统 内 部 。 另 一 种 办 法 是 
通过 使 用 有 关 通 用 寄存 器 来 传递 参数 。 显 然 , 这 些 寄存 器 应 是 系统 程序 和 用 户 程序 都 能 访 
问 的 。 不 过 ,由 于 寄存 器 长 度 也 是 较 短 的 ,从 而 无 法 传递 较 多 的 参数 。 因 此 ,在 系统 调用 较 
多 的 系统 中 ,大 多 在 内 存 中 开辟 专用 堆栈 区 来 传递 参数 。 


。 30 。 


另外 ,在 系统 发 生 访 管 中 断 或 陷阱 中 断 时 ,为 了 不 让 用 户 程 序 不 直接 访问 系统 程序 , 反 
映 处 理 机 硬件 状态 的 处 理 机 状态 字 (PSW) 中 的 相应 位 要 从 用 户 执 行 模式 转换 为 系统 执行 
模式 。 这 一 转换 在 发 生 访 管 中 断 时 由 硬件 自动 实现 。 一 般 把 处 理 机 在 用 户 程 序 中 执行 称 为 


用 户 态 


2.6.1 


,而 把 处 理 机 在 系统 程序 中 执行 称 为 系统 态 。 


2.6 Linux 和 Windows 的 系统 调用 


Linux 系统 调用 


Linux 提供 了 丰富 的 系统 调用 。 每 个 系统 调用 由 两 部 分 组 成 : 核心 函数 部 分 提供 实现 
系统 调用 功能 的 共享 代码 ,作为 操作 系统 的 核心 程序 驻 留 在 内 存 中 ;接口 函数 部 分 提供 给 应 
用 程序 API 接口 , 它 把 系统 调用 号 和 入 口 参 数 地 址 传送 给 相应 的 核心 函数 。 

Linux 提供 多 达 上 百 种 系统 调用 ,从 功能 上 大 致 可 分 为 如 下 几 类 : 


设备 管理 的 系统 调用 。 申 请 设备 ,释放 设备 ,设备 I/O 和 重 定向 ,设备 属性 获取 及 设 
置 ,多 辑 上 连接 和 释放 设备 。 

文件 系统 操作 的 系统 调用 。 建 立 文件 ,删除 文件 ,打开 文件 ,关闭 文件 , 读 写 文件 , 获 
得 和 设置 文件 属性 。 

进程 控制 的 系统 调用 。 终 止 或 异常 终止 进程 , 载 人 和 执行 进程 ,创建 和 撤销 进程 , 获 
取 和 设置 进程 属性 。 

存储 管理 的 系统 调用 。 申 请 内 存 和 释放 内 存 。 

管理 用 的 系统 调用 。 获 取 和 设置 日 期 及 时 间 ,获取 和 设置 系统 数据 。 
通信 的 系统 调用 。 建 立 和 断 开 通信 连接 ,发 送 和 接收 消息 ,传送 状态 信息 ,连接 和 断 
开 远程 设备 。 


编程 人 员 可 以 使 用 不 同 的 系统 调用 来 实现 自己 所 需要 的 功能 。 例 如 ,下 面 是 一 个 使 用 
系统 调用 打开 (open) . 读 (read) 、. 写 (write) .关闭 (close) 等 完成 文件 复制 的 例子 : 


# include <fcnt1l.h> 


#include <sys/stat.h> 
#define SIZE 1 


void filecopy (char * Infile,char* Outfile) 


{ 


char Buffer[SIZE]; 
int In fh,Out fh,Count; 
if((In_fh=open (Infile,0 RDONLY))==-1) /* 以 只 读 模式 打开 输入 文件 * / 
printf ("Opening Infile"); 
if(Out fh=open(Outfile, (O WRONLY|O CREAT|O TRUNC), (S_IRUSRIS IWUSR))==-1) 
/* 以 读 写 模式 新 建 一 个 文件 x* / 
printf ("Opening Outfile"); 
while( (Count=read (In fh,Buffer,sizeof (Buffer)))>0) 
/* 循环 地 向 缓冲 区 读 和 人 输入 文件 内 容 * / 
if (write (Out_fh,Buffer,Count)!=Count) /x* 将 缓冲 区 读 入 的 内 容 写 到 输出 文件 中 x / 
printf ("Writing data"); 
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if(Count==-1) 
printf ("Reading data"); 
close (In fh); /< 关闭 输入 文件 * / 
close (Out fh); /< 关闭 输出 文件 * / 
} 


读者 可 以 使 用 Linux 系统 调用 编写 自己 的 应 用 程序 。 
2.6.2 Windows 系统 调用 


Windows 操作 系统 也 提供 了 丰富 的 系统 调用 。 这 些 系 统 调 用 被 进一步 编写 成 不 同 的 
库 函 数 后 放 入 动态 链接 库 (DLL) 中 。 这 些 库 孔 数 构成 了 Windows 操作 系统 提供 给 程序 员 
的 编程 接口 。 这 个 编程 接口 被 称 为 应 用 编程 接口 , (Application Programming Interface， 
APTI) 。 

从 Windows 1.0 以 来 ,系统 就 提供 了 API 函数 的 调用 。 随 着 系统 的 不 断 升 级 ,API 也 
数 也 不 断 地 得 到 扩充 ,从 Win 16 API 发 展 到 Win 32 API, 高 版 本 系统 对 低 版 本 系统 的 API 
的 函数 都 提供 了 支持 。 在 Windows 2003 中 提供 的 API 函数 已 经 扩充 到 了 几 千 个 。 

常用 的 API 函数 调用 分 为 如 下 几 类 : 

(1) 窗口 管理 类 。 向 应 用 程序 提供 了 一 些 创建 和 管理 用 户 界面 的 方法 ,可 以 使 用 窗口 
管理 函数 创建 和 使 用 窗口 来 显示 输出 、 提 示 用 户 进 行 输入 以 及 完成 其 他 一 些 与 用 户 进 行 交 
互 所 需 的 工作 ,大 多 数 应 用 程序 都 至 少 要 创建 一 个 窗口 。 主 要 包括 按钮 函数 (Button) 、 光 标 
函数 CCursor) 和 对 话 框 函数 (Dialog Box) 等 的 调用 。 

(2) 图 形 设备 接口 (GDI) 类 。 提 供 了 一 系列 的 函数 和 相关 的 结构 ,应 用 程序 可 以 使 用 
它们 在 显示 器 .打印 机 或 其 他 设备 上 生成 图 形 化 的 输出 结果 。 使 用 GDI 函数 可 以 绘制 直 
线 , 曲 线 、 闭 合 图 形 、 路 径 、 文 本 以 及 位 图 图 像 。 主 要 包括 位 图 函数 (Bitmap)、 笔 刷 函 数 
(Brush) 和 颜色 函数 (Color) 等 的 调用 。 

(3) 系统 服务 类 。 为 应 用 程序 提供 了 访问 计算 机 资源 以 及 底层 操作 系统 特性 的 手段， 
比如 访问 内 存 、 文 件 系 统 、 设 备 、 进 程 和 线程 。 应 用 程序 使 用 系统 服务 函数 来 管理 和 监视 它 
所 需要 的 资源 。 主 要 包括 内 存 管理 函数 (Memory Management) ,文件 函数 (File) 以 及 进程 
和 线程 函数 (Process and Thread) 等 的 调用 。 

(4) 国际 特性 类 。 帮 助 用 户 编写 国际 化 的 应 用 程序 ,提供 给 用 户 将 应 用 程序 本 地 化 的 
一 些 功 能 。 主 要 包括 Unicode 和 字符 集 函 数 (Unicode and Character Set) 以 及 输入 方法 编 
辑 器 函数 (Input Method Editor) 等 的 调用 。 

(5) 网 络 服务 类 。 人 允许 网 络 上 的 不 同 计 算 机 的 应 用 程序 之 间 进 行 通信 ,帮助 在 网 络 中 
的 各 计算 机 上 创建 和 管理 共享 资源 的 连接 ,例如 共享 目录 和 网 络 打印 机 。 主 要 包括 
Windows 网 络 了 图 数 、Windows 套 接 字 (Socket)、NetBIOS、RAS、SNMP 和 Net 函数 等 的 
调用 。 

例如 : 

GDI32. DLL 给 出 了 屏幕 显示 及 打印 功能 的 函数 集 ; 

USER32. DLL 给 出 了 鼠标 、 键 盘 .通信 端口 声音、 时钟 功能 的 函数 集 ; 

KERNEL32. DLL 给 出 了 文件 及 内 存 管理 (核心 部 分 ) 功 能 的 函数 集 ; 

和 


MPR. DLL 给 出 了 Windows 3. 2 网 络 接口 库 。 
下 面 是 一 个 使 用 Windows API 编程 的 例子 。 在 该 例子 中 , 先 创建 一 个 文件 ,然后 向 创 
建 的 文件 中 写 入 字符 串 ,再 从 该 文件 中 将 字符 串 读 取出 来 并 通过 MessageBox 显示 。 


# include<windows .h> 
// 人 口 函 数 
int WINAPI WinMain (HINSTANCE hInstance，HINSTRNCE hPrevInstance，PSTR szCmdLine, 


int iCmdshow) 


{ 


} 


HANDLE hrile; 
LPTSTR lpBuffer="Hello World !"; 
// 创 建文 件 
hFile=CreateFile("C:\\File.txt",GENERIC READ | GENERIC WRITE, 
0, NULL,OPEN ALWAYS,FILE ATTRIBUTE NORMAL,NULL); 
CloseHandle (hFile); 
TCHAR szBuf [128]; 
DWORD dwRead; 
DWORD dwWritten; 
/7 打开 文件 
hFile=CreateFile("C:\\File.txt",GENERIC READ | GENERIC WRITE, 
0, NULL, OPEN _ ALWAYS,FILE ATTRIBUTE NORMAL, NULL); 
// 向 文件 中 写 入 一 个 字符 串 
WriteFile(hFile,lpBuffer,strlen (lpBuffer)+1, &dwRead, NULL); 
SetFilePointer (hFile,0,NULL,FILE BEGIN); 
// 从 文件 中 读 出 一 个 字符 串 并 将 它 显示 在 对 话 框 中 
if (ReadFile(hFile,szBuf,strlen(lpBuffer)+1,&dwWritten,NULL)); 
{ 
messagebox (NULL, szBuf, "EXAM", MB OK); 
} 
CloseHandle (hFile); 


在 上 述 程序 代码 中 ,使 用 了 Windows API 的 系统 服务 类 中 有 关 文 件 的 操作 函数 ,如 
CreateFile、WriteFile 及 ReadFile 等 完成 相关 的 文件 操作 。 
读者 可 从 网 站 www. msdn. com 得 到 更 多 的 关于 Windows API 的 知识 。 


本 章 小 结 


本 章 简 要 介绍 了 操作 系统 的 用 户 界面 。 操 作 系 统 的 用 户 界面 是 评价 一 个 操作 系统 优 劣 
的 重要 指标 。 操 作 系 统 的 用 户 界面 包括 命令 控制 界面 和 编程 界面 两 部 分 ,其 中 命令 控制 界 
面 是 基于 编程 界面 ,也 就 是 系统 调用 之 上 开发 而 成 的 。 

操作 系统 的 命令 控制 界面 已 从 早期 的 脱 机 控制 方式 ( 批 处 理 系统 ) 和 联机 控制 方式 (分 
时 系统 ) 转 向 多 窗口 .菜单 .按钮 以 及 声控 等 图 形 化 多 媒体 方式 。 命 令 控 制 界面 的 革命 与 进 
步 是 操作 系统 最 显著 的 变化 之 一 。 


dy 


系统 调用 是 操作 系统 提供 给 编程 人 员 的 唯一 接口 。 编 程 人 员 通 过 系统 调用 使 用 操作 系 


统 内 核 所 提供 的 各 种 功能 。 系 统 调用 的 执行 不 同 于 一 般 用 户 程 序 的 执行 。 系 统 调用 执行 是 
在 核心 态 下 执行 系统 子 程 序 , 而 用 户 程 序 则 是 在 用 户 态 下 执行 。 一 般 来 说 ,操作 系统 提供 的 
系统 调用 越 多 ,功能 也 就 越 丰 富 , 系 统 也 就 越 复杂 。 


3 吕 


中 


本 章 还 简要 介绍 了 Linux 和 Windows 系统 的 用 户 界 面 。 
习 题 


什么 是 作业 和 作业 步 ? 

作业 由 哪 几 部 分 组 成 ? 这 几 部 分 各 有 什么 功能 ? 

作业 的 输入 方式 有 哪 几 种 ? 各 有 何 特点 ? 

试 述 spooling 系统 的 工作 原理 。 

操作 系统 为 用 户 提供 哪些 接口 ? 它们 的 区 别 是 什么 ? 

作业 控制 方式 有 哪 几 种 ? 调查 你 周围 的 计算 机 的 作业 控制 方式 。 

什么 是 系统 调用 ? 系统 调用 与 一 般 用 户 程序 有 什么 区 别 ? 与 库 函 数 和 实用 程序 又 有 
什么 区 别 ? 

简 述 系统 调用 的 实现 过 程 。 

为 什么 说 分 时 系统 没有 作业 的 概念 ? 


10 Linux 操作 系统 为 用 户 提供 哪些 接口 ? 试 举例 说 明 。 
11 在 你 周围 装 有 Linux 系统 的 计算 机 上 ,查看 有 关 Shell 的 基本 命令 ,并 编写 一 个 简单 


的 Shell 程序 ,完成 一 个 已 有 数据 文件 的 复制 和 打印 。 


12 用 Linux 文件 读 写 的 相关 系统 调用 编写 copy 程序 。 
13 用 Windows 的 DLL 接口 编写 copy 程序 。 
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第 3 章 进程 管理 


3.1 进程 的 概念 


现代 操作 系统 的 重要 特点 是 在 保证 安全 的 前 提 下 ,程序 并 发 执行 ,以 及 系统 所 拥有 的 资 
源 被 共享 和 系统 的 用 户 随机 地 使 用 。 这 3 个 特点 是 互相 联系 和 互相 依赖 的 ,它们 是 互相 独 
立 的 用 户 如 何 使 用 有 限 的 计算 机 系统 资源 的 反映 。 通 常 , 操 作 系 统 的 重要 任务 之 一 是 使 用 
户 充分 有效 地 利用 系统 资源 。 采 用 一 个 什么 样 的 概念 来 描述 计算 机 程序 的 执行 过 程 和 作 
为 资源 分 配 的 基本 单位 ,才能 充分 反映 操作 系统 的 执行 并 发 .资源 共享 及 用 户 随机 的 特点 
呢 ? 这 个 概念 就 是 进程 。 为 了 讲 清 进程 的 概念 以 及 引入 进程 概念 的 必要 性 等 ,下 面 将 从 操 
作 系 统 的 特点 讲 起 。 


3.1.1 程序 的 并 发 执行 


1. 程序 

程序 (program) 描 述 计算 机 所 要 完成 的 具有 独立 功能 的 ,并 在 时 间 上 按 严 格 次 序 前 后 
相继 的 计算 机 操作 序列 集合 ,是 一 个 静态 的 概念 。 它 体现 了 编程 人 员 要 求 计算 机 完成 相应 
功能 时 所 应 该 采取 的 顺序 步骤。 

2. 程序 的 顺序 执行 

程序 只 有 经 过 执行 才能 得 到 结果 。 程 序 的 执行 又 可 以 分 为 顺序 执行 和 并 发 执行 。 计 算 
机 的 CPU 是 通过 时 序 脉冲 来 控制 顺序 执行 指令 的 。 其 执行 过 程 可 以 描述 为 

repeat IR<-M[PC] 

PEO<—PC*+L 


<Execute (instruction in IR)> 
until CPU halt 


这 里 IR 为 指令 寄存 器 ,PC 为 程序 计数 器 ,M 为 存储 器 。 显 然 , 程 序 的 顺序 性 与 计算 机 
硬件 的 顺序 性 是 一 致 的 。 我 们 把 一 个 具有 独立 功能 的 程序 独占 处 理 机 直至 最 终结 束 的 过 程 
称 为 程序 的 顺序 执行 。 程 序 的 顺序 执行 具有 如 下 特点 : 

1) 顺序 性 

程序 顺序 执行 时 ,其 执行 过 程 可 看 作 一 系列 严格 按 程序 规定 的 状态 转移 过 程 , 也 就 是 每 
执行 一 条 指令 ,系统 将 从 上 一 个 执行 状态 转移 到 下 一 个 执行 状态 , 且 上 一 条 指令 的 执行 结 
是 下 一 条 指令 执行 开始 的 充分 必要 条 件 。 

2) 封闭 性 

程序 执行 得 到 的 最 终结 果 由 给 定 的 初始 条 件 决定 ,不 受 外 界 因素 的 影响 。 

3) 可 再 现 性 

顺序 执行 的 最 终结 果 可 再 现 是 指 它 与 执行 速度 无 关 。 只 要 输入 的 初始 条 件 相 同 , 则 无 

a 


论 何 时 重复 执行 该 程序 都 会 得 到 相同 的 结果 。 

3. 多 道 程序 系统 中 程序 执行 环境 的 变化 

如 果 每 台 计 算 机 在 任 一 时 刻 只 处 理 一 个 具有 独立 功能 的 程序 ,操作 系统 的 设计 和 功能 
都 将 变 得 非常 简单 ,因为 在 这 样 的 系统 中 不 存在 资源 共享 、 程 序 的 并 发 执行 以 及 用 户 执 行 的 
随机 性 问题 。 但 是 ,在 许多 情况 下 ,计算 机 需要 能 够 同时 处 理 多 个 具有 独立 功能 的 程序 。 批 
处 理 系统 、 分 时 系统 、 实 时 系统 以 及 网 络 与 分 布 式 系 统 等 都 是 这 样 的 系统 。 因 此 ,每 个 程序 
在 执行 时 都 应 考虑 其 执行 环境 的 变化 。 这 样 的 执行 环境 具有 下 述 3 个 特点 。 

1) 独立 性 

在 多 道 环境 下 执行 的 每 道 程序 都 是 逻辑 上 独立 的 ,它们 之 间 不 存在 逻辑 上 的 制约 关系 。 
也 就 是 说 ,如 果 有 充分 的 资源 保证 , 则 每 道 程序 都 可 以 独立 执行 , 且 执 行 速度 与 其 他 程序 无 
关 ,执行 的 起 该 时 间 也 是 独立 的 。 

2) 随机 性 

在 多 道 程 序 环境 下 ,特别 是 在 多 用 户 环境 下 ,程序 和 数据 的 输入 与 执行 开始 时 间 都 是 随 
机 的 。 在 实时 系统 中 更 是 如 此 , 它 被 要 求 在 一 个 被 允许 的 短 时 间 内 对 随机 的 输入 做 出 反应 。 
输入 与 程序 执行 开始 时 间 的 随机 性 形成 了 操作 系统 必须 同时 处 理 多 道 程序 的 客观 要 求 。 

3) 资源 共享 性 

这 里 所 说 的 资源 , 既 包 括 硬件 资源 ,也 包括 软件 资源 。 硬 件 资源 包括 CPU、 输 入 输出 设 
备 和 存储 器 等 。 软 件 资源 除了 指 各 种 例 程 之 外 ,还 包括 各 种 可 共享 的 数据 。 显 然 ,任何 一 个 
计算 机 系统 中 的 软 、 硬 件 资源 都 是 有 限 的 ,特别 是 在 单 CPU 系统 中 。 一 般 来 说 ,多 道 环境 
下 执行 程序 的 道 数 总 是 要 超过 计算 机 系统 中 CPU 的 个 数 , 单 CPU 系统 更 是 如 此 。 显 然 ， 
受 CPU 个 数 的 限制 ,由 随机 性 引起 的 需 同 时 执行 的 N 道 (N 三 1) 程 序 只 能 共享 系统 中 已 有 
的 CPU。 在 单 CPU 系统 中 , 则 有 N 一 1 道 程序 处 于 等 待 CPU 的 状态 。 同 理 , 输 入 输出 设 
备 有 限 将 导致 这 些 设备 被 共享 ,内 存 有 限 将 导致 内 存 被 共享 等 。 资 源 共 享 将 导致 对 进程 执 
行 速度 的 制约 。 

4. 程序 的 并 发 (concurrent) 执 行 

1) 什么 是 程序 的 并 发 执行 

所 谓 并 发 执行 ,是 为 了 增强 计算 机 系统 的 处 理 能 力 和 提高 资源 利用 率 所 采取 的 一 种 同 
时 操作 技术 。 程 序 的 并 发 执行 可 进一步 分 为 两 种 : 第 一 种 是 多 道 程序 系统 的 程序 执行 环境 
变化 所 引起 的 多 道 程 序 的 并 发 执行 。 如 前 所 述 ,在 多 道 程序 系统 环境 下 ,各 道 程序 在 逻辑 上 
独立 ,具备 了 独立 执行 的 条 件 。 而 程序 与 数据 输入 的 随机 性 以 及 执行 起 始 时 间 的 随机 性 又 
导致 了 多 道 程序 要 求 同 时 执行 的 客观 要 求 。 由 于 资源 的 有 限 性 ,多 道 程序 的 并 发 执行 总 是 
伴随 着 资源 的 共享 与 竞争 。 从 而 制约 各 道 程 序 的 执行 速度 。 而 无 法 做 到 在 微观 上 ,也 就 是 
在 指令 级 上 的 同时 执行 。 因 此 ,尽管 多 道 程序 的 并 发 执行 在 宏观 上 是 同时 进行 的 ,但 在 微观 
上 仍 是 顺序 执行 的 ;第 二 种 并 发 执行 是 在 某 道 程序 的 几 个 程序 段 中 (例如 几 个 程序 ) 包 含 着 
一 部 分 可 以 同时 执行 或 顺序 颠倒 执行 的 代码 。 例 如 ,语句 


read (a); 


read (b); 


既 可 以 同时 执行 ,也 可 颠倒 次 序 执行 。 也 就 是 说 ,对 于 这 样 的 语句 ,同时 执行 不 会 改变 顺序 
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程序 所 具有 的 逻辑 性 质 。 因 此 ,可 以 采用 并 发 执行 来 充分 利用 系统 资源 以 提高 计算 机 的 处 
理 能 力 。 

综 上 所 述 ,程序 的 并 发 执行 可 总 结 为 : 一 组 在 逻辑 上 互相 独立 的 程序 或 程序 段 在 执行 
过 程 中 ,其 执行 时 间 在 客观 上 互相 重 疤 , 即 一 个 程序 段 的 执行 尚未 结束 , 男 一 个 程序 段 的 执 
行 已 经 开始 的 这 种 执行 方式 。 

程序 的 并 发 执行 不 同 于 程序 的 并 行 执行 。 程 序 的 并 行 执行 是 指 一 组 程序 按 独 立 的 、 异 
步 的 速度 执行 。 并 行 执行 不 等 于 时 间 上 的 重 肆 。 可 以 将 并 发 执行 过 程 描述 为 


S0 

Cobegin 
Pl;P2;°"* ;Pn 
Coend 


Sn 


这 里 ,S0,Sn 分 别 表 示 并 发 程序 段 P1,P2,…,Pn 开 始 执行 前 和 并 发 执行 结束 后 的 语句 。 
即 : 先 执行 S0 ,再 并 发 执行 P1,P2,…,Pn; 当 P1,P2,…,Pn 全 部 执行 完毕 后 ,再 执行 Sn。 
P1,P2,…,Pn 也 可 以 由 同一 程序 段 中 的 不 同 语句 组 成 。 

1966 年 Bernstein 提出 了 两 个 相 邻 语句 Si、S; 可 以 并 发 执行 的 条 件 : 

将 程序 中 任 一 语句 S; 划分 为 两 个 变量 的 集合 RC(S;) 和 W(S;)。 其 中 

R(S;)= {a az… an》 
aj(j 二 1,2,…,m) 是 语句 S; 在 执行 期 间 必须 对 其 进行 读 写 的 变量 ; 
W(S;)= {6b 0 b,} 

b;(j 王 1,2,…,n) 是 语句 S; 在 执行 期 间 必须 对 其 进行 修改 .访问 的 变量 。 

如 果 对 于 语句 S; 和 S: ,有 

© RC(S) NWGS,)= 1{$} 

©@ WS) NRGS, )= {4$} 

图 W(S) NW(S,)= {#8) 
同时 成 立 , 则 语句 S; 和 S; 是 可 以 并 发 执行 的 。 

2) 程序 的 并 发 执行 所 带 来 的 影响 

程序 的 并 发 执行 充分 地 利用 了 系统 资源 ,从 而 提高 了 系统 的 处 理 能 力 ,这 是 并 发 执行 好 
的 一 方面 。 但 是 ,正如 前 面 所 提 到 的 那样 ,由 于 系统 资源 有 限 ,程序 的 并 发 执行 必然 导致 资 
源 共 享 和 资源 竞争 ,从 而 改变 程序 的 执行 速度 。 那 么 ,由 资源 共享 和 竞争 所 引起 的 程序 执行 
速度 的 改变 是 否 会 对 程序 的 最 终结 果 带 来 不 利 的 影响 呢 ? 也 就 是 说 ,是 否 会 保持 用 户 所 期 
望 的 执行 结果 的 封闭 性 和 可 再 现 性 呢 ? 如 果 并 发 执行 的 各 程序 段 中 语句 或 指令 满足 上 述 
Bernstein 的 3 个 条 件 , 则 认为 并 发 执行 不 会 对 执行 结果 的 封闭 性 和 可 再 现 性 产生 影响 。 但 
在 一 般 情况 下 ,系统 要 判定 并 发 执行 的 各 程序 段 是 否 满足 Bernstein 条 件 是 相当 困难 的 。 如 
果 并 发 执行 的 程序 段 不 按照 特定 的 规则 和 方法 进行 资源 共享 和 竞争 , 则 其 执行 结果 将 不 可 
避免 地 失去 封闭 性 和 可 再 现 性 。 下 面 的 例子 说 明了 这 一 点 。 

例 : 设 有 堆栈 S, 栈 指针 top, 栈 中 存放 内 存 中 相应 的 数据 块 地 址 (如 图 3. 1(a) 所 示 ) 。 
设 有 两 个 程序 段 getaddr(top) 和 reladdr(blk) ,其 中 getaddr(top) 从 给 定 的 top 所 指 的 栈 中 
取出 相应 的 内 存 数据 块 地 址 ,而 reladdr(blk) 则 将 内 存 数据 块 地 址 blk 放 入 堆栈 S 中 。 

ee 


getaddr(top) 和 reladdr(blk) 可 分 别 描述 为 


procedure getaddr (top) 
begin 
localr 
<IEo) 
top < top-1 
return (r) 
end 

procedure reladdr (blk) 
begin 
top < topt+1 
(top)<— blk 


end 

显然 ,如 果 上 例 中 的 getaddr 和 reladdr 程序 段 采 用 顺序 执行 ,其 执行 结果 具有 封闭 性 
和 可 再 现 性 ;但 如 果 对 这 两 个 程序 段 采用 并 发 执行 , 则 在 单 CPU 系统 中 ,将 有 可 能 出 现下 
述 情况 ， 

首先 ,程序 段 reladdr 开始 执行 ,准备 释放 内 存 数 据 块 地 址 人 栈 。 然 而 , 当 reladdr 执行 
到 top< top 十 1 语句 时 (如 图 3. 1(b) 所 示 ) ,程序 段 getaddr 也 开始 执行 且 抢 占 了 处 理 机 ,从 
而 程序 段 reladdr 停 在 top<top 十 1 处 等 待 处 理 机 。getaddr 程序 段 的 执行 目的 是 要 从 对 应 
的 堆栈 指针 top 所 指 的 栈 格 中 取出 一 个 内 存 数据 块 地 址 ,显然 ,由 于 reladdr 程序 段 的 执行 
将 指针 top 升 高 了 一 格 且 未 放 进 适当 的 数据 ,getaddr 的 执行 结果 是 失败 的 (如 图 3.1(c) 所 
示 )。 另 外 ,如 果 改 变 程序 段 getaddr 和 reladdr 的 执行 顺序 或 执行 速度 ,又 可 得 到 不 同 的 执 
行 结果 。 这 说 明了 如 下 问题 : 在 某 些 情况 下 ,程序 的 并 发 执行 使 得 其 执行 结果 不 再 具有 封 
闭 性 和 可 再 现 性 , 且 可 能 造成 程序 出 现 错误 。 


栈 S 栈 S 栈 S 
top -一 top -一 2 ~ getaddr 
top -一 | a (执行 语句 | a | a | 取 数 失败 
b top 一 top+1)| b Lb 
a ee En 
f f 
(a) (b) (0) 


图 3.1 堆栈 的 取 数 和 存 数 过 程 


上 例 中 的 程序 段 并 发 执行 出 现 错误 结果 ,是 由 于 两 程序 段 共 享 资源 堆栈 S, 从 而 使 得 执 
行 结果 受 执行 速度 影响 。 一 般 情况 下 ,并 发 执行 的 各 程序 段 如 果 共 享 软 ,硬件 资源 ,都 会 造 
成 其 执行 结果 受 执行 速度 影响 的 局 面 。 显 然 , 这 是 程序 设计 人 员 不 希望 看 到 的 。 为 了 使 得 
在 并 发 执行 时 不 出 现 错误 结果 ,必须 采取 某 些 措施 来 制约 、 控 制 各 并 发 程序 段 的 执行 速度 。 
这 在 操作 系统 程序 设计 中 尤其 重要 ,因为 操作 系统 用 户 随 机 性 与 各 道 程序 逻辑 独立 的 特点 
将 使 得 每 个 用 户 程序 所 使 用 的 软 、 硬 件 资源 都 受到 其 他 并 发 程序 的 共享 和 竞争 ,从 而 得 到 非 
预料 的 或 不 正确 的 结果 。 为 了 控制 和 协调 各 程序 段 执 行 过 程 中 的 软 、 硬 件 资源 的 共享 和 竞 
争 , 显 然 ,必须 应 该 有 一 个 描述 各 程序 段 执行 过 程 和 共享 资源 的 基本 单位 。 从 上 述 讨论 可 以 
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看 出 ,由 于 程序 的 顺序 性 .静态 性 以 及 孤立 性 ,用 程序 段 作为 描述 其 执行 过 程 和 共享 资源 的 
基本 单位 既 增加 操作 系统 设计 和 实现 的 复杂 性 ,也 无 法 反映 操作 系统 所 应 该 具有 的 程序 段 
执行 的 并 发 性 .用户 随机 性 以 及 资源 共享 等 特征 。 也 就 是 说 ,用 程序 作为 描述 其 执行 过 程 以 
及 共享 资源 的 基本 单位 是 不 合适 的 。 需 要 有 一 个 能 描述 程序 的 执行 过 程 且 能 用 来 共享 资源 
的 基本 单位 ,这 个 基本 单位 被 称 为 进程 (或 任务 ) 。 


3.1.2 进程 的 定义 


进程 的 概念 是 20 世纪 60 年 代 初 期 首先 在 MIT 的 Multics 系统 和 IBM 公司 的 TSS/ 
360 系统 中 引用 的 。 从 那 以 后 ,人 们 对 进程 下 过 许多 各 式 各 样 的 定义 。 现 列举 其 中 几 种 : 

(1) 进程 是 可 以 并 发 执行 的 计算 部 分 (S. E. Madnick,J. T. Donovan)。 

(2) 进程 是 一 个 独立 的 可 以 调度 的 活动 (E. Cohen,D. Jofferson)。 

(3) 进程 是 一 个 抽象 实体 , 当 它 执行 某 个 任务 时 ,将 要 分 配 和 释放 各 种 资源 (了 . 
Denning ) 。 

(4) 行为 的 规则 称 为 程序 ,程序 在 处 理 机 上 执行 时 的 活动 称 为 进程 (E. W. Dijkstra)。 

(5) 一 个 进程 是 一 系列 逐一 执行 的 操作 ,而 操作 的 确切 含义 则 有 赖 于 以 何 种 详尽 程度 
来 描述 进程 (Brinch Hansen) 。 

以 上 进程 的 定义 ,尽管 各 有 侧重 ,但 在 本 质 上 是 相同 的 , 即 主要 注重 进程 是 一 个 动态 的 
执行 过 程 这 一 概念 。 也 可 以 这 样 定义 进程 : 并 发 执行 的 程序 在 执行 过 程 中 分 配 和 管理 资源 
的 基本 单位 。 

进程 和 程序 是 两 个 既 有 联系 又 有 区 别 的 概念 ,它们 的 区 别 和 联系 可 简 述 如 下 : 

(1) 进程 是 一 个 动态 概念 ,而 程序 则 是 一 个 静态 概念 。 程 序 是 指令 的 有 序 集合 ,没有 任 
何 执行 的 含义 。 而 进程 则 强调 执行 过 程 , 它 动态 地 被 创建 ,并 被 调度 执行 后 消亡 。 如 果 把 程 
序 比 作 菜谱 ,那么 进程 则 是 按照 菜谱 炒菜 的 过 程 。 

(2) 进程 具有 并 发 特征 ,而 程序 没有 。 由 进程 的 定义 可 知 ,进程 具有 并 发 特征 的 两 个 方 
面 , 即 独立 性 和 异步 性 。 也 就 是 说 ,在 不 考虑 资源 共享 的 情况 下 ,各 进程 的 执行 是 独立 的 , 执 
行 速 度 是 异步 的 。 显 然 , 由 于 程序 不 反映 执行 过 程 ,所 以 不 具有 并 发 特征 。 

(3) 进程 是 竞争 计算 机 系统 资源 的 基本 单位 ,从 而 其 并 发 性 受到 系统 自己 的 制约 。 这 
里 ,制约 就 是 对 进程 独立 性 和 异步 性 的 限制 。 

(4) 不 同 的 进程 可 以 包含 同一 程序 ,只 要 该 程序 所 对 应 的 数据 集 不 同 。 


3.2 进程 的 描述 


一 个 进程 是 一 个 程序 对 某 个 数据 集 的 执行 过 程 ,是 分 配 资源 的 基本 单位 。 那 么 ,从 处 理 
机 的 活动 角度 来 看 ,又 如 何 识别 描述 程序 执行 活动 的 进程 呢 ? 显 然 ,系统 中 需要 有 描述 进程 
存在 和 能 够 反映 其 变化 的 物理 实体 , 即 进 程 的 静态 描述 。 进 程 的 静态 描述 由 3 部 分 组 成 : 
进程 控制 块 (PCB) ,有 关 程 序 段 和 该 程序 段 对 其 进行 操作 的 数据 结构 集 。 进 程控 制 块 包 含 
了 有 关 进 程 的 描述 信息 .控制 信息 以 及 资源 信息 ,是 进程 动态 特征 的 集中 反映 。 系 统 根据 
PCB 感知 进程 的 存在 ,通过 PCB 中 所 包含 的 各 项 变量 的 变化 掌握 进程 所 处 的 状态 ,以 达到 
控制 进程 活动 的 目的 。 由 于 进程 的 PCB 是 系统 感知 进程 的 唯一 实体 ,因此 ,在 几乎 所 有 的 
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多 道 操 作 系统 中 ,一 个 进程 的 PCB 结构 都 是 全 部 或 部 分 常 驻 内 存 的 。 

进程 的 程序 部 分 描述 进程 所 要 完成 的 功能 。 而 数据 结构 集 是 程序 在 执行 时 必 不 可 少 的 
工作 区 和 操作 对 象 。 这 两 部 分 是 进程 完成 所 需 功能 的 物质 基础 。 由 于 进程 的 这 两 部 分 内 容 
与 控制 进程 的 执行 及 完成 进程 功能 直接 有 关 , 因而 ,在 大 部 分 多 道 操作 系统 中 ,这 两 部 分 内 
容 放 在 外 存 中 ,直到 该 进程 执行 时 再 调和 人 内存。 下 面 分 别 介绍 进程 的 PCB 结构 、 程 序 与 数 
据 结构 集 。 


3.2.1 进程 控制 块 


如 上 所 述 ,进程 控制 块 (PCB) 包 含 一 个 进程 的 描述 信息 、 控 制 信息 及 资源 信息 ,有 些 系 
统 中 还 有 进程 调度 等 待 所 使 用 的 现场 保护 区 。PCB 集中 反映 一 个 进程 的 动态 特征 。 在 进 
程 并 发 执行 时 ,由 于 资源 共享 , 带 来 各 进程 之 间 的 相互 制约 。 显然, 为 了 反映 这 些 制约 关系 
和 资源 共享 关系 ,在 创建 一 个 进程 时 ,应 首先 创建 其 PCB, 然 后 才能 根据 PCB 中 的 信息 对 进 
程 实施 有 效 的 管理 和 控制 。 当 一 个 进程 完成 其 功能 之 后 ,系统 则 释放 PCB, 进 程 也 随 之 
消 臣 5 

一 般 来 说 ,根据 操作 系统 的 要 求 不 同 , 进 程 的 PCB 所 包含 的 内 容 会 多 少 有 所 不 同 。 但 
是 ,下 面 所 示 的 基本 内 容 是 必需 的 。 

1. 描述 信息 

描述 信息 主要 包括 下 列 几 项 。 

(1) 进程 名 或 进程 标识 号 

每 个 进程 都 有 唯一 的 进程 名 或 进程 标识 号 。 在 识别 一 个 进程 时 ,进程 名 或 进程 标识 号 
代表 该 进程 。 

(2) 用 户 名 或 用 户 标识 号 

每 个 进程 都 隶属 于 某 个 用 户 , 用 户 名 或 用 户 标识 号 有 利于 资源 共享 与 保护 。 

(3) 家 族 关系 

在 有 的 系统 中 ,进程 之 间 互 成 家 族 关系 。 因 此 ,PCB 中 相应 的 项 描述 其 家 族 关系 。 

2. 控制 信息 

控制 信息 包括 下 列 几 项 。 

1) 进程 当前 状态 

进程 当前 状态 说 明 进 程 当 前 处 于 何 种 状态 。 进 程 在 活动 期 间 可 分 为 初始 态 ,就绪 态 、 执 
行 态 .等待 状态 和 终止 状态 。 任 一 进程 在 任 一 时 刻 只 能 处 于 这 5 种 状态 中 的 一 种 。 这 5 种 
状态 的 含义 是 : 执行 态 表 示 该 进程 占有 处 理 机 ,就 绪 态 表示 该 进程 准备 占有 处 理 机 ,而 等 待 
状态 则 表示 进程 因 某 种 原因 而 暂时 不 能 占有 处 理 机 。 在 有 的 系统 中 ,等 待 状态 会 进一步 划 
分 为 不 同 原因 或 不 同 地 点 (内 存 或 外 存 ) 的 等 待 状态 。 有 关 进 程 的 状态 在 3. 3 节 中 进一步 
讨论 。 

2) 进程 优先 级 

进程 优先 级 是 选取 进程 占有 处 理 机 的 重要 依据 。 与 进程 优先 级 有 关 的 PCB 表 项 有 以 
下 儿 项 。 

(1) 占有 CPU 时 间 ; 

(2) 进程 优先 级 偏 移 ; 
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(3) 占据 内 存 时 间 ,等 等 。 

3) 程序 开始 地 址 

程序 开始 地 址 规定 该 进程 的 程序 以 此 地 址 开始 执行 。 

4) 各 种 计时 信息 

给 出 进程 占有 和 利用 资源 的 有 关 情 况 。 

5) 通信 信息 

通信 信息 用 来 说 明 该 进程 在 执行 过 程 中 与 别 的 进程 所 发 生 的 信息 交换 情况 。 

3. 资源 管理 信息 

PCB 中 包含 最 多 的 是 资源 管理 信息 ,包括 有 关 存 储 器 的 信息 、 使 用 输入 输出 设备 的 信 
息 和 有 关 文件 系统 的 信息 等 。 这 些 信息 的 具体 内 容 如 下 : 

(1) 占用 内 存 大 小 及 其 管理 用 数据 结构 指针 ,例如 内 存 管理 中 所 用 到 的 进程 页 表 指 
针 等 。 

(2) 在 某 些 复杂 系统 中 ,还 有 对 换 或 覆盖 用 的 有 关 信 息 , 如 对 换 程 序 段 长 度 和 对 换 外 存 
地 址 等 。 这 些 信息 在 进程 申请 、 释 放 内 存 中 使 用 。 

(3) 共享 程序 段 大 小 及 起 始 地 址 。 

(4) 输入 输出 设备 的 设备 号 ,所 要 传送 的 数据 长 度 、 缓 冲 区 地 址 ,缓冲 区 长 度 及 所 用 设 
备 的 有 关 数 据 结构 指针 等 。 这 些 信息 在 进程 申请 释放 设备 进行 数据 传输 时 使 用 。 

(5) 指向 文件 系统 的 指针 及 有 关 标 识 等 。 进 程 可 使 用 这 些 信息 对 文件 系统 进行 操作 。 

4. CPU 现场 保护 结构 

当前 进程 因 等 待 某 个 事件 而 进入 等 待 状态 或 因 某 种 事件 发 生 被 中 止 在 处 理 机 上 的 执行 
时 ,为 了 以 后 该 进程 能 在 被 打 断 处 恢复 执行 ,需要 保护 当前 进程 的 CPU 现场 。PCB 中 设 有 
专门 的 CPU 现场 保护 结构 ,以 存储 退出 执行 时 的 进程 现场 数据 。 

总 之 ,PCB 是 系统 感知 进程 存在 的 唯一 实体 。 通 过 对 PCB 的 操作 ,系统 为 有 关 进 程 分 
配 资源 从 而 使 得 有 关 进 程 得 以 被 调度 执行 ;而 完成 进程 所 要 求 功能 的 程序 段 的 有 关 地 址 ,以 
及 程序 段 在 进程 过 程 中 因 某 种 原因 被 停止 执行 后 的 现场 信息 也 都 在 PCB 中 。 最 后 , 当 进 程 
执行 结束 后 , 则 通过 释放 PCB 来 释放 进程 所 占有 的 各 种 资源 。 

由 于 PCB 中 包含 较 多 的 信息 ,因此 ,一 个 PCB 表 往 往 要 占据 较 大 的 存储 空间 (一 般 占 
几 百 到 几 千 个 字 节 ) 。 在 有 的 系统 中 ,为 了 减少 PCB 对 内 存 的 占用 量 , 只 允许 PCB 中 最 常 
用 的 部 分 ,如 CPU 现场 保护 、 进 程 描述 信息 和 控制 信息 等 常 驻 内 存 。PCB 结构 中 的 其 他 部 
分 则 存放 于 外 存 之 中 , 待 该 进程 将 要 执行 时 与 其 他 数据 一 起 装 入 内 存 。 


3.2.2 进程 上 下 文 


至 此 已 经 知道 ,进程 的 静态 描述 由 进程 控制 块 (PCB)、 有 关 程 序 段 和 数据 集 组 成 ,上 面 
已 经 介绍 了 PCB。 本 节 介 绍 包括 程序 段 和 数据 集 在 内 的 上 下 文 (context) 的 概念 。 

进程 上 下 文 实际 上 是 进程 执行 过 程 中 顺序 关联 的 静态 描述 。 进 程 上 下 文 是 一 个 与 进程 
切换 和 处 理 机 状态 发 生 交 换 有 关 的 概念 。 在 进程 执行 过 程 中 ,由 于 中 断 、 等 待 或 程序 出 错 等 
原因 造成 进程 调度 ,这 时 操作 系统 需要 知道 和 记忆 进程 已 经 执行 到 什么 地 方 或 新 的 进程 将 
从 何 处 执行 。 另 外 ,进程 执行 过 程 中 还 经 常 出 现 调用 子 程序 的 情况 。 在 调用 子 程序 执行 后 ， 
进程 将 返回 何 处 继续 执行 ,执行 结果 将 返回 或 存放 到 什么 地 方 等 都 需要 进行 记忆 。 
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因此 ,进程 上 下 文 是 一 个 抽象 的 概念 , 它 包 含 了 每 个 进程 执行 过 的 、 执 行 时 的 以 及 待 执 
行 的 指令 和 数据 ,在 指令 寄存 器 \ 堆 栈 (存放 各 调用 子 程 序 的 返回 点 和 参数 等 ) 和 状态 字 寄 存 
器 等 中 的 内 容 。 

已 执行 过 的 进程 指令 和 数据 在 相关 寄存 器 与 堆栈 中 的 内 容 称 为 上 文 , 正 在 执行 的 指令 
和 数据 在 寄存 器 与 堆栈 中 的 内 容 称 为 正文 , 待 执行 的 指令 和 数据 在 寄存 器 与 堆栈 中 的 内 容 
称 为 下 文 。 

在 不 发 生 进 程 调度 时 ,进程 上 下 文 的 改变 都 是 在 同一 进程 内 进行 的 ,此 时 ,每 条 指令 的 
执行 对 进程 上 下 文 的 改变 较 小 ,一 般 反 映 为 指令 寄存 器 \ 程 序 计数 器 以 及 保存 调用 子 程序 返 
回 接口 用 的 堆栈 值 等 的 变化 

同一 进程 的 上 下 文 的 结 吉 构 由 与 执行 该 进程 有 关 的 各 种 寄存 器 中 的 值 .程序 段 经 过 编译 后 
形成 的 机 器 指令 代码 集 ( 或 称 正文 段 ) .数据 集 及 各 种 堆栈 值 与 PCB 结构 构成 ( 见 图 3. 2) 。 

这 里 ,有 关 寄 存 器 和 栈 区 的 内 容 是 重要 的 。 例 如 ,没有 程序 计数 器 PC 和 程序 状态 字 寄 
存 器 PSW ,CPU 将 无 法 知道 下 条 待 执行 指令 的 地 址 和 控制 有 关 操 作 。 

图 3.3 是 UNIX System V 的 进程 上 下 文 组 成 示例 。 在 UNIX System V 中 ,进程 上 下 
文 由 用 户 级 上 下 文 、 寄 存 器 上 下 文 以 及 系统 级 上 下 文 组 成 。 用 户 级 上 下 文 由 进程 的 用 户 程 
序 段 部 分 编译 而 成 的 用 户 正 文 段 .用户 数据 和 用 户 栈 等 组 成 。 而 寄存 器 上 下 文 则 由 程序 寄 
存 器 (PC) .处理 机 状态 字 寄 存 器 (PSW) 、 栈 指针 和 通用 寄存 器 的 值 组 成 。 其 中 ,PC 给 出 
CPU 将 要 执行 的 下 条 指令 的 虚 地 址 ;PSW 给 出 机 器 与 该 进程 相关 联 时 的 硬件 状态 ,例如 当 
前 执行 模式 、 能 否 执 行 特权 指令 等 ; 栈 指针 指向 下 一 项 的 当前 地 址 ,而 通用 寄存 器 则 用 于 不 
同 执行 模式 之 间 的 参数 传递 等 。 


用 户 级 上 下 文 加 4 
进程 正文 段 、 数 据 、 
栈 等 | 
寄存 器 上 下 文 
PC 的 值 | 
PSW 的 值 层 保存 的 第 n-1 层 | 栈 
栈 指针 全 ”| 寄存 器 上 下 文 
通用 寄存 器 的 值 : ; 
系统 级 上 下 文 | 结 
保存 的 第 
各 种 正文 集 静态 部 分 : 层 2| 寄存 器 上 下 文 
一 一 | ”控制 表 PCB 结构 
| 恋 己 ;| 保存 的 第 0 层 
PCB 指针 数据 集 地 址 变换 用 表格 时 层 1 | 寄存 器 上 下 文 构 
= 动态 部 分 = 
一 | 各 种 寄存 器 一 栈 区 层 0| 寄存 器 上 下 文 
图 3.2 进程 上 下 文 结构 图 3.3 UNIX System V 进程 上 下 文 组 成 


进程 的 系统 级 上 下 文 又 分 为 静态 部 分 与 动态 部 分 。 这 里 的 动态 部 分 不 是 指 程序 的 执 
行 , 而 是 指 在 进入 和 退出 不 同 的 上 下 文 层次 时 ,系统 为 各 层 上 下 文中 相关 联 的 寄存 器 值 所 保 
存 和 恢复 的 记录 。 

系统 级 上 下 文 的 静态 部 分 包括 PCB 结构 ,将 进程 虚 地 址 空间 映射 到 物理 空间 用 的 有 关 
表格 和 核心 栈 。 这 里 ,核心 栈 主 要 用 来 装载 进程 中 所 使 用 的 系统 调用 的 调用 序列 。 

系统 级 上 下 文 的 动态 部 分 是 与 寄存 器 上 下 文 相关 联 的 。 进 程 上 下 文 的 层次 概念 也 主要 
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体现 在 动态 部 分 中 , 即 系统 级 上 下 文 的 动态 部 分 可 看 成 是 一 些 数量 变化 的 层次 组 成 的 。 其 
变化 规则 满足 先进 后 出 的 堆栈 方式 ,每 个 上 下 文 层次 在 栈 中 各 占 一 项 。 


3.2.3 进程 上 下 文 切换 


提出 进程 上 下 文 的 概念 主要 是 为 了 进程 上 下 文 的 切换 。 

进程 上 下 文 切 换 发 生 在 不 同 的 进程 之 间 而 不 是 同一 个 进程 内 。 

进程 上 下 文 切换 过 程 一 般 包 含 3 个 部 分 ,并 涉及 3 个 进程 。 第 一 部 分 为 保存 被 切换 进 
程 的 正文 部 分 (或 当前 状态 ) 至 有 关 存 储 区 ,例如 该 进程 的 PCB 中 。 第 二 部 分 是 操作 系统 进 
程 中 有 关 调 度 和 资源 分 配 程序 执行 ,并 选取 新 的 进程 。 第 三 部 分 则 是 将 被 选中 进程 的 原来 
被 保存 的 正文 部 分 从 有 关 存 储 区 中 取出 ,并 送 至 有 关 寄 存 器 与 堆栈 中 ,激活 被 选中 进程 
执行 。 

进程 上 下 文 切 换 过 程 如 图 3.4 所 示 。 

进程 上 下 文 的 切换 过 程 涉 及 谁 来 保护 和 获取 进程 的 正文 问题 ,也 就 是 如 何 使 寄存 器 和 
堆栈 等 中 的 数据 流入 流出 PCB 的 存储 区 。 

进程 上 下 文 切换 还 涉及 系统 调度 和 分 配 程 序 ,这 些 都 比较 耗费 CPU 时 间 。 

为 了 提高 系统 执行 效率 ,有 的 计算 机 在 设计 时 采用 了 多 组 寄存 器 技术 。 即 进程 上 下 文 
切换 时 ,不 保留 被 切换 进程 上 下 文 的 正文 ,但 保留 切换 进程 执行 时 所 使 用 的 寄存 器 。 这 就 减 
少 了 数据 保存 和 获取 所 耗费 的 时 间 。 

近年 来 ,为 了 进一步 提高 执行 效率 ,又 提出 了 线程 的 概念 ,本 书 将 在 后 面 的 章节 中 讲述 。 
1 进程 Pi 执行 
中 断 或 进程 调用 


了 
保存 进程 P| 正文 至 PCB， 


| 


选取 新 进程 PP ， 人 恢复 PP 上下文 昌 户 空间 


新 进程 P, 执 行 , 
1 | 系统 空间 


图 3.4 进程 上 下 文 的 切换 过 程 图 3.5 进程 空间 示例 


3.2.4 进程 空间 与 大 小 


任 一 进程 ,都 有 一 te 该 空间 称 为 进程 空间 或 虚空 间 ( 有 关 虚 空间 的 概 
念 将 在 第 5 章 中 讲述 ) 。 空间 的 大 小 只 与 处 理 机 的 位 数 有 关 。 例 如 ,一 个 16 位 长 处 理 
机 的 进程 空间 大 小 为 i 32 位 长 处 理 机 的 进程 空间 大 小 为 2*。 程 序 的 执行 都 在 进程 空 
间 内 进行 。 用 户 程序 、 进 程 的 各 种 控制 表格 等 都 按 一 定 的 结构 排列 在 进程 空间 中 。 另 外 ,在 
UNIX 以 及 Linux 等 操作 系统 中 ,进程 空间 还 被 划分 为 用 户 空 间 和 系统 空间 两 大 部 分 (如 
图 3.5 所 示 》。 

在 进程 空间 被 划分 为 两 大 部 分 后 ,用 户 程 序 在 用 户 空间 内 执行 ,而 操作 系统 内 核 程 序 则 
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在 系统 空间 内 执行 。 

另外 ,为 了 防止 用 户 程 序 访 问 系统 空间 ,造成 访问 出 错 , 计 算 机 系统 还 通过 程序 状态 寄 
存 器 等 设置 不 同 的 执行 模式 , 即 用 户 模式 和 系统 模式 来 进行 保护 。 人 们 也 把 用 户 执行 模式 
和 系统 执行 模式 分 别称 为 用 户 态 和 系统 态 。 

进程 空间 将 在 第 5 章 存储 管理 部 分 中 进一步 描述 。 

进程 的 大 小 就 是 进程 空间 的 大 小 。 


3.3 ”进程 状态 及 其 转换 


3.3.1 进程 状态 


一 个 进程 的 生命 期 可 以 划分 为 一 组 状态 ,这 些 状 态 刻 画 了 整个 进程 。 系 统 根 据 PCB 结 
构 中 的 状态 值 控制 进程 。 前 面 已 介绍 过 ,一 个 进程 在 并 发 执行 中 ,由 于 资源 共享 与 竞争 ,有 
时 处 于 执行 状态 。 有 时 ,进程 则 因 等待 某 种 事件 发 生 而 处 于 等 待 状态 。 另 外 , 当 一 个 处 于 等 
待 状态 的 进程 因 等 待 事件 发 生 被 唤醒 后 ,又 因 不 可 能 立即 得 到 处 理 机 而 进入 就 绪 状态 。 进 
程 刚 被 创建 时 ,由 于 其 他 进程 正 占有 处 理 机 而 得 不 到 执行 ,只 能 处 于 初始 状态 。 进 程 在 执行 
结束 后 ,将 退出 执行 而 被 终止 ,这 时 进程 处 于 终止 状态 。 因 此 ,在 进程 的 生命 期 内 ,一 个 进程 
至 少 具 有 5 种 基本 状态 : 初始 态 ,执行 状态 .等 待 状态 .就 绪 状 态 和 终止 状态 。 

处 于 就 绪 状态 的 进程 已 经 得 到 除 CPU 之 外 的 其 他 资源 ,只 要 由 调度 得 到 处 理 机 , 便 可 
立即 投入 执行 。 

在 有 些 系 统 中 ,为 了 有 效 地 利用 内 存 , 就 绪 状 态 又 可 进一步 分 为 内 存 就 绪 状 态 和 外 存 就 
绪 状态 。 在 这 样 的 系统 中 ,只 有 处 于 内 存 就 绪 状态 的 进程 在 得 到 处 理 机 后 才能 立即 投入 执 
行 ; 而 处 于 外 存 就 绪 状 态 的 进程 只 有 先 成 为 内 存 就 绪 状态 后 , 才 可 能 被 调度 执行 。 这 种 方式 
明显 地 提高 了 内 存 的 利用 效率 ,但 反 过 来 也 增加 了 系统 开销 和 系统 复杂 性 。 

在 单 CPU 系统 中 , 任 一 时 刻 处 于 执行 状态 的 进程 只 能 有 一 个 。 只 有 处 于 就 绪 状 态 的 
进程 经 调度 选中 之 后 才 可 进入 执行 状态 。 

在 某 些 操作 系统 中 ,一 个 进程 在 其 生命 期 内 的 执行 过 程 中 ,总 要 涉及 用 户 程序 和 操作 系 
统 内 核 程序 两 部 分 。 因 此 ,进程 的 执行 状态 又 可 进一步 划分 为 用 户 执行 状态 (简称 为 用 户 
态 ) 和 系统 执行 状态 (简称 为 系统 态 或 核心 态 )。 进 程 的 用 户 程 序 段 在 执行 时 ,该 进程 处 于 用 
户 态 。 而 一 个 进程 的 系统 程序 段 在 执行 时 ,该 进程 处 于 系统 态 。 为 什么 要 划分 用 户 态 和 系 
统 态 呢 ?一 个 最 主要 的 原因 是 要 把 用 户 程序 和 系统 程序 区 分 开 来 ,以 利于 程序 的 共享 和 保 
护 。 显 然 ,这 也 是 以 增加 系统 复杂 度 和 系统 开销 为 代价 的 。 

进程 因 等 待 某 个 事件 发 生 而 放弃 处 理 机 进入 等 待 状态 。 显 然 , 等 待 状态 可 根据 等 待 事 
件 的 种 类 而 进一步 划分 为 不 同 的 子 状态 ,例如 内 存 等 待 、 设 备 等 待 、 文 件 等 待 和 数据 等 待 等 。 
这 样 做 的 好 处 是 系统 控制 简单 ,发 现 和 唤醒 相应 的 进程 较为 容易 。 但 系统 中 设置 过 多 的 状 
态 又 会 造成 系统 参数 和 状态 转换 过 程 的 增加 。 


3.3.2 进程 状态 转换 


进程 的 状态 反映 进程 执行 过 程 的 变化 。 这 些 状态 随 着 进程 的 执行 和 外 界 条 件 的 变化 而 
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转换 。 那 么 ,是 什么 样 的 条 件 使 得 进程 各 状态 发 生 转 换 呢 ? 图 3.6 给 出 了 5 个 基本 状态 , 即 
初始 状态 、 就 绪 状 态 .执行 状态 .等 待 状态 与 终止 状态 之 间 的 转换 关系 。 


因 等 待 事件 
发 生 而 唤醒 


图 3.6 进程 状态 转换 


事实 上 ,进程 的 状态 转换 是 一 个 非常 复杂 的 过 程 。 从 一 个 状态 到 另 一 个 状态 的 转换 除 
了 要 使 用 不 同 的 控制 过 程 (将 在 3.4 节 中 讲述 ), 有 时 还 要 借助 于 硬件 触发 器 才能 完成 。 例 
如 ,在 UNIX 系统 中 ,从 系统 态 到 用 户 态 的 转换 要 借助 硬件 触发 器 完成 。 


3.4 进程 控制 


进程 和 处 理 机 管理 的 一 个 重要 任务 是 进程 控制 。 所 谓 进程 控制 ,就 是 系统 使 用 一 些 具 
有 特定 功能 的 程序 段 来 创建 、 撤 销 进 程 以 及 完成 进程 各 状态 间 的 转换 ,从 而 达到 多 进程 高 效 
率 并 发 执行 和 协调 、 实 现 资源 共享 的 目的 。 一 般 地 ,把 系统 态 下 执行 的 某 些 具有 特定 功能 的 
程序 段 称 为 原 语 。 原 语 可 分 为 两 类 : 一 类 是 机 器 指令 级 的 ,其 特点 是 执行 期 间 不 允许 中 断 ， 
正如 在 物理 学 中 的 原子 一 样 ,在 操作 系统 中 , 它 是 一 个 不 可 分 割 的 基本 单位 ; 另 一 类 是 功能 
级 的 ,其 特点 是 作为 原 语 的 程序 段 不 允许 并 发 执行 。 这 两 类 原 语 都 在 系统 态 下 执行 , 且 都 是 
为 了 完成 某 个 系统 管理 所 需要 的 功能 和 被 高 层 软 件 所 调用 。 

显然 ,系统 在 创建 .撤销 一 个 进程 以 及 要 改变 进程 的 状态 时 ,都 要 调用 相应 的 程序 段 来 
完成 这 些 功 能 。 那 么 ,这 些 程序 段 是 不 是 原 语 呢 ? 如 果 它 们 不 是 原 语 , 则 由 上 述 原 语 的 定义 
可 知 ,这 些 程序 段 是 允许 并 发 执行 的 。 然 而 ,如 果 不 加 控制 和 管理 地 让 这 些 控 制 进程 状态 转 
换 及 创建 和 撤销 进程 的 程序 段 并 发 执行 , 则 会 使 得 其 执行 结果 失去 封闭 性 和 可 再 现 性 (为 什 
么 ? 由 读者 自 答 ), 从 而 达 不 到 进程 控制 的 目的 。 反 过 来 ,如 果 对 这 些 程序 段 采 用 下 面 所 述 
的 控制 方法 使 其 在 并 发 执行 过 程 中 也 能 完成 进程 控制 任务 的 话 , 将 会 大 大 增加 系统 的 开销 
和 复杂 度 。 因 此 ,在 操作 系统 中 ,通常 把 进程 控制 用 程序 段 做 成 原 语 。 用 于 进程 控制 的 原 语 
有 创建 原 语 、 撤 销 原 语 .阻塞 原 语 和 唤醒 原 语 等 。 


3.4.1 进程 创建 与 撤销 


1. 进程 创建 
进程 创建 方式 有 以 下 几 种 。 
(1) 由 系统 程序 模块 统一 创建 。 例 如 ,在 批 处 理 系统 中 ,由 操作 系统 的 作业 调度 程序 为 
用 户 作业 创 建 相 应 的 进程 以 完成 用 户 作 业 所 要 求 的 功能 。 
(2) 由 父 进 程 创建 。 例 如 ,在 层次 结构 的 系统 中 , 父 进程 创建 子 进 程 以 完成 并 行 工作 。 
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由 系统 统一 创建 的 进程 之 间 的 关系 是 平等 的 ,它们 之 间 一 般 不 存在 资源 继承 关系 。 而 
父 进程 与 父 进 程 创 建 的 进程 之 间 则 存在 隶属 关系 , 且 互 相 构 成 树 形 结构 的 家 族 关系 。 属 于 
某 个 家 族 的 一 个 进程 可 以 继承 其 父 进 程 所 拥有 的 资源 。 另 外 ,无 论 是 哪 一 种 方式 创建 进程 ， 
在 系统 生成 时 ,都 必须 由 操作 系统 创建 一 部 分 承担 系统 资源 分 配 和 管理 工作 的 系统 进程 。 

无 论 是 系统 创建 方式 还 是 父 进 程 创 建 方式 ,都 必须 调用 创建 原 语 来 实现 。 创 建 原 语 扫 
描 系 统 的 PCB 链表 ,在 找到 一 定 的 PCB 表 之 后 , 填 入 调用 者 提供 的 有 关 参 数 ,最 后 形成 代 
表 进 程 的 PCB 结构 。 这 些 参 数 包括 进程 名 、 进 程 优先 级 P0 .进程 正文 段 起 始 地 址 d0 和 资 
源 清单 RO 等 。 其 实现 过 程 如 图 3.7 所 示 。 

2. 进程 撤销 

以 下 几 种 情况 导致 进程 被 撤销 : 

(1) 该 进程 已 完成 所 要 求 的 功能 而 正常 终止 ; 

(2) 由 于 某 种 错误 导致 非 正 常 终止 ; 

(3) 祖先 进程 要 求 撤销 某 个 子 进 程 。 

无 论 哪 一 种 情况 导致 进程 被 撤销 ,进程 都 必须 释放 它 所 占用 的 各 种 资源 和 PCB 结构 本 
身 , 以 利于 资源 的 有 效 利 用 。 当 然 , 一 个 进程 所 占有 的 某 些 资源 在 使 用 结束 时 可 能 早已 释 
放 。 另 外 , 当 一 个 祖先 进程 撤销 某 个 子 进 程 时 ,还 需 审 查 该 子 进 程 是 否 还 有 自己 的 子孙 进 
程 ,车 有 的 话 , 还 需 撤 销 其 子孙 进程 的 PCB 结构 并 释放 它们 所 占有 的 资源 (为 什么 ?” 请 思 
考 )。 

撤销 原 语 首先 检查 PCB 进程 链 或 进程 家 族 ,寻找 所 要 撤销 的 进程 是 否 存 在 。 如 果 找 到 
了 所 要 撤销 的 进程 的 PCB 结构 , 则 撤销 原 语 释 放 该 进程 所 占有 的 资源 之 后 ,把 对 应 的 PCB 
结构 从 进程 链 或 进程 家 族 中 摘 下 并 返回 给 PCB 空 队列 。 如 果 被 撤销 的 进程 有 自己 的 子 进 
程 , 则 撤销 原 语 先 撤销 其 子 进程 的 PCB 结构 并 释放 子 进程 所 占用 的 资源 之 后 ,再 撤销 当前 
进程 的 PCB 结构 并 释放 其 资源 。 撤 销 原 语 的 实现 过 程 如 图 3.8 所 示 。 


CA ) 
1 入 
i CAXD ) 
1 
! 区 查 进程 链表 或 进程 家 族 
有 空 PCB? 
1 
1 有 天 有 此 PCB 吗 ? 
取 空 表 PCBD 创建 失败 有 
| 出 错 处 理 有 
将 有 关 参 数 填 入 PCB() 相 应 项 该 PCB 有 子 进程 吗 ? 
1 无 
PCB(i) 入 就 结 队列 释放 该 进程 所 占有 的 资源 
1 1 
PCB(i) 入 进程 家 族 或 进程 链 释放 该 PCB 结构 本 身 
1 1 
图 3.7 创建 原 语 流 图 图 3.8 撤销 原 语 流 图 
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3.4.2 进程 的 阻塞 与 唤醒 


进程 的 创建 原 语 和 撤销 原 语 完成 了 进程 从 无 到 有 、 从 存在 到 消亡 的 变化 。 被 创建 后 的 
进程 最 初 处 于 就 绪 状 态 ,然后 经 调度 程序 选中 后 进入 执行 状态 。 有 关 进 程 调度 部 分 将 放 在 
第 4 章 中 详 述 , 这 里 主要 介绍 实现 进程 的 执行 状态 到 等 待 状态 ,又 由 等 待 状态 到 就 绪 状 态 转 
换 的 两 种 原 语 , 即 阻塞 原 语 与 唤醒 原 语 。 

阻塞 原 语 在 一 个 进程 期 待 某 一 事件 (例如 键盘 输入 数据 . 写 盘 .其 他 进程 发 来 的 数据 等 ) 
发 生 , 但 发 生 条 件 尚 不 具备 时 ,被 该 进程 自己 调用 来 阻塞 自己 。 阻 塞 原 语 在 阻塞 一 个 进程 
时 ,由 于 该 进程 正 处 于 执行 状态 , 故 应 先 中 断 处 理 机 和 保存 该 进程 的 CPU 现场 。 然 后 将 被 
阻塞 进程 置 " 阻 塞 " 状 态 后 插入 等 待 队列 中 ,再 转 进程 调度 程序 选择 新 的 就 绪 进程 投入 运行 。 
阻塞 原 语 的 实现 过 程 如 图 3. 9 所 示 。 这 里 , 转 进程 调度 程序 是 很 重要 的 ,和 否则 ,处 理 机 将 会 
出 现 空转 而 浪费 资源 。 

当 等 待 队列 中 的 进程 所 等 待 的 事件 发 生 时 ,等 待 该 事件 的 所 有 进程 都 将 被 唤醒 。 显 然 ， 
一 个 处 于 阻塞 状态 的 进程 不 可 能 自己 唤醒 自己 (为 什么 ? 请 思考 ) 唤 醒 一 个 进程 有 两 种 方 
法 : 一 种 是 由 系统 进程 唤醒 。 另 一 种 是 由 事件 发 生 进 程 唤醒 。 当 由 系统 进程 唤醒 等 待 进程 
时 ,系统 进程 统一 控制 事件 的 发 生 并 将 “事件 发 生 ” 这 一 消息 通知 等 待 进程 。 从 而 使 得 该 进 
程 因 等 待 事件 已 发 生 而 进入 就 绪 队 列 。 等 待 进程 也 可 由 事件 发 生 进程 唤醒 。 由 事件 发 生 进 
程 唤醒 时 ,事件 发 生 进 程 和 被 唤醒 进程 之 间 是 合作 关系 。 因 此 ,唤醒 原 语 既 可 被 系统 进程 调 
用 ,也 可 被 事件 发 生 进 程 调用 。 调 用 唤醒 原 语 的 进程 称 为 唤醒 进程 。 唤 醒 原 语 首先 将 被 唤 
醒 进 程 从 相应 的 等 待 队列 中 摘 下 ,将 被 唤醒 进程 置 为 就 绪 状 态 之 后 , 送 入 就 绪 队 列 。 在 把 被 
唤醒 进程 送 入 就 绪 队 列 之 后 ,唤醒 原 语 既 可 以 返回 原 调用 程序 ,也 可 以 转向 进程 调度 ,以 便 
让 调度 程序 有 机 会 选择 一 个 合适 的 进程 执行 。 唤 醒 原 语 的 实现 框图 如 图 3. 10 所 示 。 


人 
保存 当前 进程 的 CPU 现场 从 等 待 队列 ET 
置 该 进程 的 状态 生计 并 
被 阻塞 进程 和 等待 队列 TT 
转 进程 调度 ET 
图 3.9 阻塞 原 语 图 3. 10 唤醒 原 语 
3.5 进程 互 斥 


3.5.1 资源 共享 所 引起 的 制约 


在 介绍 进程 的 概念 时 ,已 经 讲 过 进程 具有 独立 性 和 异步 性 等 并 发 特征 。 但 是 在 计算 机 
系统 中 ,由 于 资源 有 限 , 又 导致 了 进程 之 间 的 资源 竞争 和 共享 。 因 此 ,进程 的 并 发 执行 不 仅 
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仅 是 用 户 程序 的 执行 开始 Was 也 是 资源 有 限 性 导致 资 
源 的 竞争 与 共享 对 进程 的 执行 过 程 进行 制约 所 造成 的 。 那 么 ,在 进程 的 并 发 执行 过 程 中 存 
在 哪些 制约 呢 ? 下 面 来 看 这 个 问题 。 

1. 临界 区 

在 描述 一 个 程序 或 算法 时 ,总 是 认为 存在 一 个 伪 处 理 机 ,可 以 按 程 序 或 算法 所 规定 的 步 
Be id 但 是 ,事实 上 ,在 实际 的 系统 中 则 往往 不 是 这 样 ,这 一 点 在 3. 1.1 
节 已 介绍 。 一 般 说 来 ,即使 是 程序 中 所 描述 的 一 条 语句 ,也 是 由 多 条 执行 指令 构成 的 。 例 
如 ,各 种 程序 中 经 常 出 现 的 赋值 语句 


X=X+17 


在 用 汇编 语言 书写 时 ,就 变 成 


LOAD A,X 
ADDI A,l 
STORE A,X 


3 条 语句 ,这 里 A 代表 累加 器 。 根 据 系统 的 设计 和 要 求 ,在 这 3 条 语句 的 执行 期 间 , 也 有 可 
能 发 生 中 断 或 调度 ,从 而 使 得 与 当前 进程 无 关 的 程序 得 以 执行 。 为 了 保证 程序 执行 最 终结 
果 的 正确 性 ,必须 对 并 发 执行 的 各 进程 进行 制约 ,以 控制 它们 的 执行 速度 和 对 资源 的 竞争 。 
在 3.1. 2 节 中 已 经 介绍 了 进程 中 两 相 邻 语句 可 并 发 执行 的 3 个 条 件 。 可 是 ,在 实际 系统 中 ， 
要 检验 即将 执行 的 两 相 邻 语句 是 否 满足 这 3 个 条 件 要 花 去 巨大 的 系统 开销 。 那 么 ,是否 有 
一 种 更 为 简单 的 办 法 来 检查 出 需要 对 程序 的 哪些 部 分 进行 制约 才能 保证 其 执行 结果 的 正确 
性 呢 ? 这 里 来 看 下 面 的 例子 。 

设 有 两 个 计算 进程 Ps 和 Ps 共享 内 存 MS。 其 中 MS 分 为 3 个 区 域 , 即 系统 区 .进程 工 
作 区 和 数据 区 。 这 里 数据 区 被 划分 为 大 小 相等 的 块 ,每 个 块 中 既 可 能 放 有 数据 ,也 有 可 能 未 
放 有 数据 。 系 统 区 主要 是 堆栈 S, 其 中 存放 那些 空 数据 块 的 地 址 (如 图 3. 11 所 示 )。 


系统 区 | 进程 p、| 多 
的 程序 | | LA 
top- 一 [NM 
进程 Ps NN 
税 § | 的 程序 7 和 一 和 一 


图 3.11 多 进程 共享 内 存 栈 区 示例 


当 进 程 Pa 或 Ps 要 求 空 数据 块 时 ,从 堆栈 最 顶部 (top 指针 所 指 的 位 置 ) 取 出 所 需 数据 
块 ; 当 进程 Pa 或 Ps 释放 数据 块 时 , 则 把 所 释放 数据 块 的 地 址 放 入 堆栈 顶部 。 令 getspace 
为 取 空 数据 块 过 程 ,release(ad) 为 释放 数据 块 过 程 。 这 里 ,ad 为 待 释放 数据 块 的 地 址 。 如 
果 堆 栈 S 非 空 的 话 , 进程 Pa 或 Ps 是 可 以 用 任意 的 顺序 释放 和 获取 数据 块 的 。 执 行 
getspace 就 是 获取 一 个 空 数据 块 ,而 执行 release(ad) 就 是 释放 一 个 地 址 为 ad 的 数据 块 。 然 
而 ,由 下 面 的 描述 可 以 看 到 ,在 进程 并 发 执行 时 ,getspace 或 release(ad) 将 有 可 能 完 不 成 所 
要 求 的 功能 。 

getspace 和 release(ad) 可 进一步 描述 为 
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getspace: begin local g 
g< stack [top ] 
top<top-1 
end 
release (ad): begin 
top<topt+1 
stack [ top ]<ad 


end 


设 时 刻 t0 时 ,top 王 h0, 则 getspace 和 release(ad) 可 能 按 以 下 顺序 执行 : 

首先 release(ad) 的 第 一 句 执 行 , 即 

t0: top< -top 十 1 一 top 一 h0 十 1; 

接着 getspace 执行 , 即 

tl: g<—stack [top]—>g= stack [h0 十 1]; 

t2: top<top 一 1 一 top 一 h0; 

再 是 release(ad) 的 第 二 名 执行 , 即 

t3: stack [Ltop]<ad->stack [h0]<—ad; 
其 结果 是 调用 getspace 的 进程 取 到 的 是 ho 十 1 中 的 一 个 未 定义 值 ,而 调用 release(ad) 的 进 
程 把 所 释放 的 空 块 地 址 ad 重新 放 入 了 ho 中 。 

怎样 保证 上 述 执行 结果 的 正确 性 呢 ? 一 个 较为 明显 的 答案 是 ,如 果 把 getspace 和 
release(ad) 抽 象 为 两 个 各 以 一 个 动作 完成 的 顺序 执行 单位 ,那么 执行 结果 的 正确 性 是 可 以 
保证 的 。 

把 不 允许 多 个 并 发 进程 交叉 执行 的 一 段 程序 称 为 临界 部 分 (critical section) 或 临界 区 
(critical region) 。 

临界 区 是 由 属于 不 同 并 发 进程 的 程序 段 共享 公用 数据 或 公用 数据 变量 而 引起 的 ,例如 
上 例 中 就 是 因为 过 程 getspace 和 release(ad) 共 同 访问 栈 S 中 的 数据 而 引起 的 。 临 界 区 不 
可 能 用 增加 硬件 的 方法 来 解决 。 因 此 ,临界 区 也 可 以 被 称 为 访问 公用 数据 的 那 段 程序 。 

2. 间接 制约 

一 般 来 说 ,可 以 把 那些 不 允许 交叉 执行 的 临界 区 按 不 同 的 公用 数据 划分 为 不 同 的 集合 。 
在 上 例 中 ,以 公用 数据 栈 S 划分 的 临界 区 集合 是 (getspace, release}。 把 这 些 集合 称 为 类 
(class)。 显 然 ,对 类 给 定 一 个 唯一 的 标识 名 ,系统 就 会 容易 地 区 分 它们 。 在 程序 的 描述 中 ， 
可 用 下 列 标准 形式 来 描述 临界 区 : 


when< 类 名 >do< 临 界 区 >od 
设 类 {getspace,release}) 的 类 名 为 sp, 则 getspace 和 release(ad) 可 重新 描述 为 : 


getspace: when sp do getspce< stack [top ] 
top<top-1 od 

release (ad): when sp do top< top+1 
stack [ top ]<ad od 


把 这 种 由 于 共享 某 一 公有 资源 而 引起 的 在 临界 区 内 不 允许 并 发 进程 交叉 执行 的 现象 ， 
称 为 由 共享 公有 资源 而 造成 的 对 并 发 进程 执行 速度 的 间接 制约 ,简称 间接 制约 。 这 里 ， 间 
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接 ” 二 字 主 要 是 指 各 并 发 进程 的 速度 受 公有 资源 制约 ,而 不 是 进程 间 直 接 制约 的 意思 。 

这 里 , 受 间 接 制约 的 类 中 各 程序 段 在 执行 顺序 上 是 任意 的 。 

显然 ,对 于 每 一 类 ,系统 应 有 相应 的 分 配 和 释放 相应 公有 资源 的 管理 办 法 ,以 制约 并 发 
进程 。 这 就 是 互 斥 。 

3. 什么 是 互 斥 

综 上 所 述 ,可 以 把 互 斥 定义 为 : 一 组 并 发 进程 中 的 一 个 或 多 个 程序 段 , 因 共享 某 一 公有 
资源 而 导致 它们 必须 以 一 个 不 允许 交叉 执行 的 单位 执行 。 也 就 是 说 ,不 允许 两 个 以 上 的 共 
享 该 资源 的 并 发 进程 同时 进入 临界 区 称 为 互 斥 。 

这 里 ,考虑 类 中 只 有 一 个 元 素 , 也 就 是 只 有 一 个 程序 段 的 情况 是 很 有 意思 的 。 这 时 程序 
段 本 身 为 公有 资源 ,被 并 发 进程 共享 。 一 般 情 况 下 ,作为 程序 段 的 一 个 过 程 不 允许 多 个 进程 
同时 访问 它 。 但 如 果 该 过 程 是 纯 过 程 , 则 各 并 发 进程 可 以 同时 访问 它 。 纯 过 程 是 指 在 执行 
过 程 中 不 改变 过 程 自身 代码 的 一 类 过 程 。 通 常 ,在 计算 机 系统 中 ,有 许多 过 程 是 被 多 个 并 发 
进程 共享 ,例如 编辑 程序 、 编 译 程序 等 。 把 一 个 过 程 作 成 纯 过 程 可 便于 多 个 进程 共享 ,但 由 
于 编制 纯 过 程 必须 对 有 关 变 量 和 工作 区 作 相 应 的 处 理 ,从 而 使 其 执行 效率 往往 会 受到 一 定 
的 影响 。 

一 组 并 发 进程 互 斥 执行 时 必须 满足 如 下 准则 : 

(1) 不 能 假设 各 并 发 进程 的 相对 执行 速度 。 即 各 并 发 进程 享有 平等 地 ,独立 地 竞争 共 
有 资源 的 权利 , 且 在 不 采取 任何 措施 的 条 件 下 ,在 临界 区 内 任 一 指令 结束 时 ,其 他 并 发 进程 
可 以 进入 临界 区 。 

(2) 并 发 进程 中 的 某 个 进程 不 在 临界 区 时 , 它 不 阻止 其 他 进程 进入 临界 区 。 

(3) 并 发 进程 中 的 若干 个 进程 申请 进入 临界 区 时 ,只 能 允许 一 个 进程 进入 。 

(4) 并 发 进程 中 的 某 个 进程 从 申请 进入 临界 区 时 开始 ,应 在 有 限时 间 内 得 以 进入 临 
界 区 。 

这 里 ,准则 (1)、(2)、(3) 是 保证 各 并 发 进程 享有 平等 地 、 独 立地 竞争 和 使 用 公有 资源 的 
权利 , 且 保 证 每 一 时 刻 至 多 只 有 一 个 进程 在 临界 区 。 而 准则 (4) 则 是 并 发 进程 不 发 生死 锁 
(将 在 后 面 讲 述 ) 的 重要 保证 。 否 则 ,由 于 某 个 并 发 进程 长 期 占有 临界 区 ,其 他 进程 则 因为 不 
能 进入 临界 区 而 进入 互相 等 待 状态 。 

在 一 组 并 发 执行 进程 中 ,除了 因为 竞争 公有 资源 而 引起 的 间接 制约 带 来 进程 之 间 互 斥 
之 外 ,还 存在 因为 并 发 进程 互相 共享 对 方 的 私有 资源 所 引起 的 直接 制约 。 直 接 制约 将 使 得 
各 并 发 进程 同步 执行 。 有 关 直 接 制约 与 进程 间 的 同步 将 在 后 续 章 节 中 讨论 。 下 面 ,将 讨论 
互 斥 的 实现 方法 。 


3.5.2 互 斥 的 加 锁 实 现 


3.5.1 节 中 给 出 了 临界 区 的 摘 述 方法 和 并 发 进程 互 斥 执行 时 所 必须 遵守 的 准则 。 但 是 ， 
并 没有 给 出 怎样 实现 并 发 进程 的 互 斥 。 人 们 可 能 认为 只 需 把 临界 区 中 的 各 个 过 程 按 不 同 的 时 
间 排 列 调用 就 行 了 。 但 事实 上 这 是 不 可 能 的 。 因 为 这 要 求 该 组 并 发 进程 中 的 每 个 进程 事先 知 
道 其 他 并 发 进程 与 系统 的 动作 ,由 用 户 程 序 执行 开始 的 随机 性 可 知 , 这 是 不 可 能 的 。 

一 种 可 能 的 办 法 是 对 临界 区 加 锁 以 实现 互 斥 。 当 某 个 进程 进入 临界 区 之 后 , 它 将 锁 上 
临界 区 ,直到 它 退 出 临界 区 时 为 止 。 并 发 进程 在 申请 进入 临界 区 时 ,首先 测试 该 临界 区 是 否 
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是 上 锁 的 。 如 果 该 临界 区 已 被 锁 住 , 则 该 进程 要 等 到 该 临界 区 开锁 之 后 才 有 可 能 获得 临界 

区 。 设 临界 区 的 类 名 为 S。 为 了 保证 每 一 次 临界 区 中 只 能 有 一 个 程序 段 被 执行 ,又 设 锁定 

位 为 keyLSj, 它 表示 该 锁定 位 属于 类 名 为 S 的 临界 区 。 加 锁 后 的 临界 区 程序 描述 如 下 : 
lock (key[S]) 


< 临 界 区 > 
unlock (key[S]) 


设 keyLSj] 二 1 时 表示 类 名 为 S 的 临界 区 可 用 ,key LS]=0 时 表示 类 名 为 S 的 临界 区 不 
可 用 。 则 ,unlock(key LS]) 只 用 一 条 语句 即 可 实现 , 即 
key[S]<1 


不 过 ,由 于 lock(key [S]) 必 须 满足 key [Sj 二 0 时 不 允许 任何 进程 进入 临界 区 ,而 key 
LS]=1 时 仅 允 许 一 个 进程 进入 临界 区 的 准则 ,因而 实现 起 来 较为 困难 。 


一 种 简便 的 实现 方法 是 
lock (x): begin Local V 
repeat 
bt 


until v=1 
0 


end 


不 过 ,这 种 实现 方法 是 不 能 保证 并 发 进程 互 斥 执行 所 要 求 的 准则 (3) 的 。 因 为 当 同 时 有 
几 个 进程 调用 lock(keyLS]) 时 ,在 x<-0 语句 执行 之 前 ,可 能 已 有 两 个 以 上 的 进程 由 于 key 
LSj=1 而 进入 临界 区 。 为 了 解决 这 个 问题 ,有 些 计算 机 在 硬件 中 设置 了 “测试 与 设置 ”(test 
and set) 指 令 , 从 而 保证 第 一 步 和 第 二 步 执行 的 不 可 分 离 性 。 

这 里 ,有 一 点 需要 注意 的 是 : 在 系统 实现 时 锁定 位 keyLS] 总 是 设置 在 公有 资源 所 对 应 
的 数据 结构 中 的 。 


3.5.3 信号 量 和 P、V 原 语 


1. 信号 量 (semaphore) 

尽管 用 加 锁 的 方法 可 以 实现 进程 之 间 的 互 斥 ,但 这 种 方法 仍然 存在 一 些 影响 系统 可 靠 
性 和 执行 效率 的 问题 。 例 如 ,循环 测试 锁定 位 将 损耗 较 多 的 CPU 计算 时 间 。 如 果 一 组 并 
发 进程 的 进程 数 较 多 , 且 由 于 每 个 进程 在 申请 进入 临界 区 时 都 得 对 锁定 位 进行 测试 ,这 种 开 
销 是 很 大 的 。 

另外 ,使 用 加 锁 法 实现 进程 间 互 斥 时 ,还 将 导致 在 某 些 情况 下 出 现 不 公平 现象 。 试 考虑 
以 下 进程 PA。 和 Ps 反复 使 用 临界 区 的 情况 。 

进程 PA : 


A: lock (key[S]) 
<S> 
unlock (key[S]) 
GotoA 
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进程 Ps : 


B: lock (key[S]) 
<S> 
unlock (key[S]) 
Goto B 


设 进程 PA 已 通过 lock(keyLS]) 过 程 而 进入 临界 区 。 显 然 , 在 进程 PA 执行 unlock(key 
[S]) 过 程 之 前 ,key[LS]=0 且 进 程 Ps 没有 进入 临界 区 的 机 会 。 然 而 , 当 进程 PA 执行 完 
unlock(keyLS]) 过 程 之 后 ,由 于 紧 接 着 是 一 条 转向 语句 ,进程 Ps 将 又 立即 去 执行 lock(key 
[LS]) 过 程 。 此 时 ,由 于 unlock(keyLSj]) 过 程 已 将 keyLS] 的 值 置 为 1, 也 就 是 开锁 状态 ,从 而 
进程 PA 又 可 进入 临界 区 S。 只 有 在 进程 Ps 执行 完 unlock(keyLS]) 过 程 之 后 、 执 行 Goto A 
语句 之 前 的 瞬间 发 生 进 程 调度 ,使 进程 Ps 把 处 理 机 转让 给 进程 Ps ,进程 Ps 才 有 可 能 得 到 
执行 。 然 而 遗憾 的 是 ,这 种 可 能 性 是 非常 小 的 。 因 此 ,进程 Ps 将 处 于 永久 饥饿 状态 
(starvation) 。 

怎样 解决 上 述 问 题 呢 ? 首先 ,必须 找到 产生 上 述 问题 的 原因 。 显 然 ,在 用 加 锁 法 解决 进 
程 互 斥 的 问题 时 ,一 个 进程 能 否 进入 临界 区 是 依靠 进程 自己 调用 lock 过 程 去 测试 相应 的 锁 
定位 。 也 就 是 说 ,每 个 进程 能 否 进入 临界 区 是 依靠 自己 的 测试 判断 。 这 样 , 没 有 获得 执行 机 
会 的 进程 当然 无 法 判断 ,从 而 出 现 不 公平 现象 。 而 获得 了 测试 机 会 的 进程 又 因 需 要 测试 而 
损失 一 定 的 CPU 时 间 。 这 正如 某 个 学 生 想 使 用 某 个 人 人 都 可 借用 , 且 不 规定 使 用 时 间 的 
教室 一 样 ,他 必须 首先 申请 获得 使 用 该 教室 的 权利 ,然后 再 到 教室 看 看 该 教室 是 不 是 被 锁 上 
了 。 如 果 该 教室 被 锁 上 了 ,他 只 好 下 次 再 来 观察 ,看 该 教室 的 门 是 否 已 被 打开 。 这 种 反复 将 
持续 到 他 进门 为 止 。 从 这 个 例子 中 ,可 以 得 到 解决 加 锁 法 所 带 来 的 问题 的 方法 。 一 种 最 直 
观 的 办 法 是 ,设置 一 个 教室 管理 员 。 从 而 ,如 果 有 学 生 申 请 使 用 教室 而 未 能 如 愿 时 ,教室 管 
理 员 记 下 他 的 名 字 , 并 等 到 教室 门 一 打开 就 通知 该 学 生 进 入 。 这 样 , 既 减少 了 学 生 多 次 来 去 
教室 检查 门 是 否 被 打开 的 时 间 , 又 减少 了 因为 学 生 自 发 地 检查 造成 的 不 公平 现象 (有 的 学 生 
可 能 来 几 十 次 也 进 不 了 教室 门 ,但 有 的 学 生 可 能 一 次 就 进去 了 ,或 不 断 地 出 出 进 进 )。 在 操 
作 系 统 中 ,这 个 管理 员 就 是 信号 量 。 信 号 量 管理 相应 临界 区 的 公有 资源 , 它 代表 可 用 资源 
实体 。 

盲 号 量 的 概念 和 下 面 所 述 的 P、V 原 语 是 荷兰 科学 家 E. W. Dijkstra 提出 来 的 。 信 号 
是 铁路 交通 管理 中 的 一 种 常用 设备 ,交通 管理 人 员 利 用 信号 颜色 的 变化 来 实现 交通 管理 。 
在 操作 系统 中 ,信号 量 sem 是 一 个 整数 。 在 sem 大 于 等 于 零 时 代表 可 供 并 发 进程 使 用 的 资 
源 实体 数 ,但 sem 小 于 零 时 则 表示 正在 等 待 使 用 临界 区 的 进程 数 。 显 然 , 用 于 互 斥 的 信号 
量 sem 的 初 值 应 该 大 于 零 ,而 建立 一 个 信号 量 必须 说 明 所 建 信号 量 代表 的 意义 , 赋 初 值 , 以 
及 建立 相应 的 数据 结构 ,以便 指向 那些 等 待 使 用 该 临界 区 的 进程 。 

2. P.V 原 语 

信号 量 的 数值 仅 能 由 P、V 原 语 操作 改变 (P 和 V 分 别 是 荷兰 语 Passeren 和 Verhoog 
的 头 一 个 字母 ,相当 于 英文 的 pass 和 increment 的 意思 )。 采 用 PV 原 语 ,可 以 把 类 名 为 S 
的 临界 区 描述 为 When S do P(sem) 临 界 区 VCsem)od。 

这 里 ,sem 是 与 临界 区 内 所 使 用 的 公用 资源 有 关 的 信号 量 。 一 次 了 原 语 操作 使 得 信和 号 
量 sem 减 1 ,而 一 次 V 原 语 操作 将 使 得 信号 量 sem 加 1。 必 须 强 调 的 一 点 是 , 当 某 个 进程 正 
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在 临界 区 内 执行 时 ,其 他 进程 如 果 执 行 了 了 原 语 操作 , 则 该 进程 并 不 像 调用 lock 时 那样 因 
进 不 了 临界 区 而 返回 到 lock 的 起 点 ,等 以 后 重新 执行 测试 ,而 是 在 等 待 队列 中 等 待 有 其 他 
进程 做 V 原 语 操作 释放 资源 后 ,进入 临界 区 ,这 时 ,P 原 语 的 执行 才 算 真正 结束 。 另 外 , 当 
有 好 几 个 进程 执行 P 原 语 未 通过 而 进入 等 待 状态 之 后 ,如 有 某 进 程 执行 了 V 原 语 操作 , 则 
等 待 进程 中 的 一 个 可 以 进入 临界 区 ,但 其 他 进程 必须 等 待 。 

P 原 语 操作 的 主要 动作 如 下 : 

(1) sem 减 1。 

(2) 若 sem 减 1 后 仍 大 于 或 等 于 零 , 则 了 原 语 返回 ,该 进程 继续 执行 。 

(3) 若 sem 减 1 后 小 于 零 , 则 该 进程 被 阻塞 后 进入 与 该 信号 相对 应 的 队列 中 ,然后 转 进 
程 调度 。 

P 原 语 操作 的 功能 框图 如 图 3. 12 所 示 。 

V 原 语 的 操作 主要 动作 如 下 : 

(1) sem 加 1。 

(2) 若 相 加 结果 大 于 零 ,V 原 语 停止 执行 ,该 进程 返回 调用 处 ,继续 执行 。 

(3) 若 相 加 结果 小 于 或 等 于 零 , 则 从 该 信号 的 等 待 队列 中 唤醒 一 个 等 待 进程 ,然后 再 返 
回 原 进程 继续 执行 或 转 进程 调度 。 

V 原 语 操 作 的 功能 框图 如 图 3. 13 所 示 。 


(人 加 (CA 入口) 
1 1 
sem=sem—1 sem=sem+1 


sem<0 可 
1 是 
返回 
调用 进程 入 等 待 队列 唤醒 等 待 队列 中 的 一 个 进程 
1 1 
转 进程 调度 返回 或 转 进 程 调度 
图 3.12 P 原 语 操作 功能 图 3.13 YV 原 语 操作 功能 


有 了 加 锁 法 的 基础 ,大 家 应 该 明白 为 什么 P、V 过 程 要 以 原 语 实现 的 原因 。 和 否则 ,如 果 
多 个 进程 同时 调用 了 操作 或 V 操作 的 话 , 则 有 可 能 在 P 操作 刚 执行 完 sem 一 1 而 未 把 对 应 
进程 送 入 等 待 队列 时 ,V 操作 开始 执行 。 从 而 ,V 操作 将 无 法 发 现 等 待 进程 而 返回 。 因 此 ， 
P、V 操作 都 必须 以 原 语 实 现 , 且 在 P.V 原 语 执行 期 间 不 允许 中 断 发 生 。 

关于 P、V 原 语 的 实现 ,有 许多 方法 。 这 里 介绍 一 种 使 用 加 锁 法 的 软件 实现 方法 ,其 实 
现 过 程 描述 如 下 : 


P(sem) : 
begin 
封锁 中 断 ; 
lock(lockbit) 
val[lsem]=val[lsem]-1 


if val [sem]<0 
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保护 当前 进程 cPU 现场 
当前 进程 状态 置 为 "等 待 " 
将 当前 进程 插入 信号 sem 等 待 队列 
让 
unlock (lockbit) ;开放 中 断 
end 
V(sem) : 
begin 
封锁 中 断 ; 
lock (lockbit) 
val[sem]=val[sem]+1 
if val[sem] 志 0 
local k 
从 sem 等 待 队列 中 选取 一 个 等 待 进程 ,将 其 指针 置信 kk 中 
将 k 插 入 就 绪 队 列 
fi 
unlock (lockbit) ;开放 中 断 
end 


3.5.4 用 PV 原 语 实现 进程 互 斥 


利用 P、V 原 语 和 信和 号 量 , 可 以 方便 地 解决 并 发 进程 的 互 斥 问题 ,而 且 不 会 产生 使 用 加 
锁 法 解决 互 斥 问题 时 所 出 现 的 问题 。 

设 信 号 量 sem 是 用 于 互 斥 的 信号 量 , 且 其 初 值 为 1 表示 没有 并 发 进程 使 用 该 临界 区 。 
显然 ,由 3. 5. 3 节 的 讨论 可 知 , 只 要 把 临界 区 置 于 PCsem) 和 V(sem) 之 间 , 即 可 实现 进程 间 
的 互 床 。 当 一 个 进程 想 要 进入 临界 区 时 , 它 必 须 先 执行 P 原 语 操作 以 将 信号 量 sem 减 1 。 
在 一 个 进程 完成 对 临界 区 的 操作 之 后 , 它 必须 执行 V 原 语 操作 以 释放 它 所 占用 的 临界 区 。 
由 于 信号 量 初始 值 为 1, 所 以 , 任 一 进程 在 执行 P 原 语 操 作 之 后 将 sem 的 值 变 为 0, 表示 该 
进程 可 以 进入 临界 区 。 在 该 进程 未 执行 V 原 语 操作 之 前 如 有 另 一 进程 想 进 入 临界 区 的 话 ， 
它 也 应 先 执 行 P 原 语 操作 ,从 而 使 sem 的 值 变 为 一 1, 因 此 ,第 二 个 进程 将 被 阻塞 。 直 到 第 
一 个 进程 执行 V 原 语 操作 之 后 ,sem 的 值 变 为 0, 从 而 可 唤醒 第 二 个 进程 进入 就 绪 队 列 ,经 
调度 后 再 进入 临界 区 。 在 第 二 个 进程 执行 完 V 原 语 操作 之 后 ,如 果 没 有 其 他 进程 申请 进入 
临界 区 的 话 , 则 sem 又 恢复 到 初始 值 。 

用 信号 量 实现 两 个 并 发 进程 Ps 和 Ps 互 斥 的 描述 如 下 : 

(1) 设 sem 为 互 斥 信号 量 , 其 取 值 范 围 为 (1,0, 一 1)。 其 中 sem 王 1 表示 进程 Ps 和 Ps 
都 未 进入 类 名 为 S 的 临界 区 ,sem 二 0 表示 进程 Pa 或 Ps 已 进入 类 名 为 S 的 临界 区 ,sem 一 
一 1 表示 进程 Ps 和 Ps 中 ,一 个 进程 已 进入 临界 区 ,而 另 一 个 进程 等 待 进入 临界 区 。 

(2) 实现 过 程 描述 如 下 : 


Bez 
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V(sem) 


Pa : 
P (sem) 
<S> 


V(sem) 


3.6 进程 同步 


3.6.1 同步 的 概念 


3.5 节 中 ,由 并 发 进程 同时 访问 公有 数据 和 公有 变量 等 对 公有 资源 的 竞争 ,引出 了 进程 
互 斥 的 概念 以 及 互 斥 的 实现 方法 。 那 么 ,除了 对 公有 资源 的 竞争 而 引起 的 间接 制约 之 外 ,并 
发 进程 之 间 是 否 还 存在 着 其 他 制约 关系 影响 执行 速度 呢 ? 现在 来 看 下 面 的 例子 。 

计算 进程 和 打印 进程 共同 使 用 同一 缓冲 区 Buf。 计 算 进 程 反复 地 把 每 次 计算 结果 放 入 
Buf 中 ,而 打印 进程 则 把 计算 进程 每 次 放 入 Buf 中 的 数据 通过 打印 机 打印 输出 。 如 果 不 采 
取 任 何 制约 措施 ,这 两 个 进程 的 执行 起 始 时 间 和 执行 速度 都 是 彼此 独立 的 ,其 相应 的 控制 段 
可 以 描述 如 下 : 


Pe: 
A:local Buffer 
repeat 
Buffer<- Buf 
until Buf= 空 
计算 
得 到 计算 结果 
Buf<- 计 算 结 果 
gotoA 
Py 
B:local Pri 
repeat 
Pri<-Buf 
until Pri 关 空 
打印 Buf 中 的 数据 
清除 Buf 中 的 数据 


gotoB 

这 里 ,如 果 假 定 进程 Pe 和 Pe 对 公用 缓冲 区 Buf 已 采取 了 互 斥 措施 。 

显然 ,如 果 按 上 面 的 描述 并 发 执行 进程 Pe 和 Pp 的 话 , 则 会 造成 CPU 时 间 的 极 大 浪费 
(因为 其 中 包含 两 处 反复 测试 语句 )。 这 是 操作 系统 设计 要 求 不 允许 的 。CPU 时 间 的 浪费 
主要 是 由 于 进程 Pe 和 Ps 的 执行 互相 制约 所 引起 的 。Pc 的 输出 结果 是 Pp 的 执行 条 件 , 反 
过 来 ,Pe 的 执行 结果 也 是 Pe 的 执行 条 件 。 这 种 现象 在 操作 系统 和 用 户 进 程 中 大 量 存在 。 
这 与 3. 5 节 中 讲述 的 进程 互 斥 是 不 同 的 ,进程 互 斥 时 它们 的 执行 顺序 可 以 是 任意 的 。 一 组 
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在 异步 环境 下 的 并 发 进程 ,各 自 的 执行 结果 互 为 对 方 的 执行 条 件 , 从 而 限制 各 进程 的 执行 速 
度 的 过 程 称 为 并 发 进程 间 的 直接 制约 。 这 里 异步 环境 主要 指 各 并 发 进程 的 执行 起 始 时 间 的 
随机 性 和 执行 速度 的 独立 性 。 正 如 在 上 面 例子 中 所 看 到 的 那样 ,如 果 没 有 相应 的 解决 方法 ， 
进程 的 直接 制约 将 会 造成 大 量 的 CPU 时 间 浪 费 。 一 种 最 为 简单 和 直观 的 方法 是 直接 制约 
的 进程 互相 给 对 方 进程 发 送 执行 条 件 已 经 具备 的 信号 。 这 样 ,被 制约 进程 即 可 省 去 对 执行 
条 件 的 测试 ,只 要 收 到 了 制约 进程 发 来 的 信号 便 开始 执行 ,而 在 未 收 到 制约 进程 发 来 的 信号 
时 便 进入 等 待 状态 。 

把 异步 环境 下 的 一 组 并 发 进程 因 直 接 制约 而 互相 发 送 消息 而 进行 互相 合作 、 互 相等 待 ， 
使 得 各 进程 按 一 定 的 速度 执行 的 过 程 称 为 进程 间 的 同步 。 具 有 同步 关系 的 一 组 并 发 进程 称 
为 合作 进程 ,合作 进程 间 互 相 发 送 的 信号 称 为 消息 或 事件 。 如 果 对 一 个 消息 或 事件 赋予 唯 
一 的 消息 名 , 则 可 用 过 程 


wait (消息 名 ) 
表示 进程 等 待 合作 进 程 发 来 的 消息 ,而 用 过 程 
signal (消息 名 ) 


表示 向 合作 进程 发 送 消息 。 利 用 过 程 wait 和 signal, 可 以 简单 地 描述 上 面 例子 中 的 计算 进 
程 Pe 和 打印 进程 Pp 的 同步 关系 如 下 : 

(1) 设 消息 名 Bufempty 表示 Buf 空 ,消息 名 Buffull 表示 Buf 中 装 满 了 数据 。 

(2) 初始 化 Bufempty 二 true, Buffull= false。 

(3) 描述 如 下 : 


Pe: 

A: wait (Bufempty) 
计算 
Buf< 一 计算 结 
Bufempty<-false 
signal (Buffull) 
goto 和 

Pp: 

B: wait (Buffull) 
打印 Buf 中 的 数据 
清除 Buf 中 的 数据 
Buffull<-false 
signal (Bufempty) 
gotoB 


过 程 wait 的 功能 是 等 待 到 消息 名 为 true 的 进程 继续 执行 ,而 signal 的 功能 则 是 向 合作 
进程 发 送 合作 进程 所 需要 的 消息 名 ,并 将 其 值 置 为 true。 
3.6.2 私 用 信号 量 

上 面 用 wait( 消 息 名 ) 与 signal( 消 息 名 ) 的 方式 描述 了 进程 同步 的 一 种 实现 方法 。 事 实 


上 ,使 用 3. 5 节 介 绍 的 信号 量 的 方法 也 可 实现 进程 间 的 同步 。 
。 56 。 


一 般 来 说 ,也 可 以 把 各 进程 之 间 发 送 的 消息 作为 信号 量 看 待 。 与 进程 互 斥 时 不 同 的 是 ， 
这 里 的 信号 量 只 与 制约 进程 及 被 制约 进程 有 关 而 不 是 与 整 组 并 发 进程 有 关 。 因 此 , 称 该 信 
号 量 为 私 用 信号 量 (private semaphore) 。 一 个 进程 P; 的 私 用 信和 号 量 Sem; 是 从 制约 进程 发 
送 来 的 进程 P; 的 执行 条 件 所 需要 的 消息 。 与 私 用 信和 号 量 相对 应 , 称 互 斥 时 使 用 的 信号 量 ; 


公用 信号 量 。 
3.6.3 用 PV 原 语 操 作 实现 同步 


有 了 私 用 信号 量 的 概念 ,可 以 使 用 P、V 原 语 操作 实现 进程 间 的 同步 ,其 实现 方法 与 利 
用 wait 和 signal 过 程 时 相同 ,也 是 分 为 3 步 。 首 先 为 各 并 发 进程 设置 私 用 信和 号 量 , 然 后 为 
私 用 信号 量 赋 初 值 ,最 后 利用 P、V 原 语 和 私 用 信号 量规 定 各 进程 的 执行 顺序 。 

例 : 设 进程 Ps 和 Ps 通过 缓冲 区 队列 传递 数据 (如 图 3. 14 所 示 )。Pa 为 发 送 进 程 ,Ps 
为 接收 进程 。PA 发 送 数据 时 调用 发 送 过 程 deposit(data) ,Ps 接收 数据 时 调用 过 程 remove 
Cdata) ,上 且 数据 的 发 送 和 接收 过 程 满足 如 下 条 件 : 

(1) 在 Ps 至 少 送 一 块 数据 人 一 个 缓冲 区 之 前 ,Ps 不 可 能 从 缓冲 区 中 取出 数据 (假定 数 
据 块 长 等 于 缓冲 区 长 度 ) 。 

(2) PA 往 缓 冲 队 列 发 送 数 据 时 ,至 少 有 一 个 缓冲 区 是 空 的 。 

(3) 由 Ps 发 送 的 数据 块 在 缓冲 队列 中 按 先进 先 出 (FIFO) 方 式 排列 。 

描述 发 送 过 程 deposit(data) 和 接收 过 程 remove( data)。 


Buf 上 一 | Buf> 广 一 … 一 一 | Buf; 上 -| Buf， ~@3) 


图 3.14 缓冲 区 队列 


解 : 由 题 意 可 知 ,进程 PA 调用 的 过 程 deposit (data) 和 进程 Ps 调用 的 过 程 remove 
(data) 必 须 同步 执行 ,因为 过 程 deposit(data) 的 执行 结果 是 过 程 remove(data) 的 执行 条 件 ， 
而 当 缓 冲 队 列 全 部 装 满 数 据 时 ,remove(data) 的 执行 结果 又 是 deposit(data) 的 执行 条 件 , 满 
足 同步 定义 。 从 而 , 按 以 下 3 步 描述 过 程 deposit(data) 和 remove( data):; 

(1) 设 Bufempty 为 进程 Ps 的 私 用 信号 量 ,Buffull 为 进程 Ps 的 私 用 信号 量 。 

(2) 令 Bufempty 的 初始 值 为 n(n 为 缓冲 队列 的 缓冲 区 个 数 ) ,Buffull 的 初始 值 为 0。 

(3) 实现 过 程 描 述 如 下 : 


Pa: deposit (data): 
begin local x 
P(Bufempty); 
按 FIFO 方式 选择 一 个 空 缓冲 区 Buf (x) 
Buf (x) < data 
Buf (x) 置 满 标记 
V(Buffull) 
end 
Pa : remove (data): 
begin local x 
P (Buffull); 
按 FIFO 方式 选择 一 个 装 满 数据 的 缓冲 区 Buf (x) 
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data< Buf (x) 
Buf (x) 置 空 标记 
V (Bufempty) 


end 


这 里 ,局 部 变量 x 用 来 指明 缓冲 区 的 区 号 ,给 Buf(x) 置 标志 位 是 为 了 便于 区 别 和 搜索 
空 缓冲 区 及 非 空 缓冲 区 。( 思 考 : 在 该 题 中 需要 考虑 互 斥 吗 ? 为 什么 ?如 果 每 次 只 允许 一 
个 进程 对 缓冲 队列 进行 操作 时 怎么 办 ?) 


3.6.4 生产 者 -消费 者 问题 


把 并 发 进程 的 同步 和 互 斥 问题 一 般 化 ,可 以 得 到 一 个 抽象 的 一 般 模 型 , 即 生产 者 -消费 
者 问题 (producer-consumer problems) 。 计 算 机 系统 中 ,每 个 进程 都 申请 使 用 和 释放 各 种 不 
同类 型 的 资源 ,这些 资源 既 可 以 是 外 设 内存 及 缓冲 区 等 硬件 资源 ,也 可 以 是 临界 区 ,数据 和 
例 程 等 软件 资源 。 把 系统 中 使 用 某 一 类 资源 的 进程 称 为 该 资源 的 消费 者 ,而 把 释放 同类 资 
源 的 进程 称 为 该 资源 的 生产 者 。 例 如 ,在 上 面 的 计算 进程 Pc 与 打印 进程 Pp 公用 一 个 缓冲 
区 的 例子 中 ,计算 进程 Pc 把 数据 送 入 缓冲 区 ,打印 进程 Pp 从 缓冲 区 中 取 数 据 打 印 输出 , 因 
此 ,Pc 进程 相当 于 数据 资源 的 生产 者 ,而 Pp 进程 相当 于 消费 者 。 

把 一 个 长 度 为 n 的 有 界 缓冲 区 (nn 二 0) 与 一 群生 产 者 进程 Pi ,Ps,…,P 和 一 群 消费 者 
进程 C1 ,Cs，… ,Cs 联系 起 来 (如 图 3.15 所 示 )。 


Pe 有 界 缓冲 区 n 三 Ci 
P; C 
BE -| C; 
一 一 G 


图 3.15 生产 者 -消费 者 问题 


设 生产 者 进程 和 消费 者 进程 是 互相 等 效 的 ,其 中 ,各 生产 者 进程 使 用 的 过 程 deposit 
(data) 和 各 消费 者 使 用 的 过 程 remove(data) 可 描述 如 下 : 

首先 ,可 以 看 到 ,上 述 生产 者 -消费 者 问题 是 一 个 同步 问题 。 即 生产 者 和 消费 者 之 间 满 
足 如 下 条 件 : 

(1) 消费 者 想 接收 数据 时 ,有 界 缓冲 区 中 至 少 有 一 个 单元 是 满 的 。 

(2) 生产 者 想 发 送 数 据 时 ,有 界 缓冲 区 中 至 少 有 一 个 单元 是 空 的 。 

另外 ,由 于 有 界 缓冲 区 是 临界 资源 ,因此 ,各 生产 者 进程 和 各 消费 者 进程 之 间 必 须 互 斥 
执行 。 

由 以 上 分 析 , 设 公用 信号 量 mutex 保证 生产 者 进程 和 消费 者 进程 之 间 的 互 斥 , 设 信 号 
量 avail 为 生产 者 进程 的 私 用 信号 量 , 信 号 量 full 为 消费 者 进程 的 私 用 信号 量 。 信 号 量 avail 
表示 有 界 缓冲 区 中 的 空 单元 数 , 初 值 为 n; 信 号 量 full 表示 有 界 缓冲 区 中 非 空 单元 数 , 初 值 
为 0。 信号 量 mutex 表示 可 用 有 界 缓冲 区 的 个 数 , 初 值 为 1。 从 而 有 


deposit (data): 
begin 
Pl(avail) 


。 58 。 


P (mutex') 
送 数据 和 人 缓冲 区 某 单 元 


V(fu11) 


V (mutex) 

end 

remove (data): 

begin 
P(full) 
P (mutex) 
取 缓冲 区 中 某 单元 数据 
V(avail) 
V (mutex) 


end 


在 上 例 中 ,由 于 一 个 过 程 中 包含 几 个 公用 信号 量 和 私 用 信号 量 , 因 此 ,P、V 原 语 的 操作 
次 序 要 非常 小 心 。 一 般 说 来 ,由 于 V 原 语 是 释放 资源 的 ,所 以 可 以 以 任意 次 序 出 现 。 但 了 
原 语 则 不 然 , 如 果 次 序 混乱 ,将 会 造成 进程 之 间 的 死 锁 。 关 于 死 锁 ,将 在 3. 8 节 中 介绍 。 


3.7 进程 通信 


本 节 介 绍 进程 间 互 相传 递 信息 的 方法 和 原理 。 通 信 (communication) 意 味 着 在 进程 间 
传送 数据 。 操 作 系统 可 以 被 看 作 是 由 各 种 进程 组 成 的 ,例如 用 户 进程 计算 进程 和 打印 进程 
等 。 这 些 进程 都 具有 各 自 的 独立 功能 , 且 大 多 数 被 外 部 需要 而 启动 执行 。 一 般 来 说 ,进程 间 
的 通信 根据 通信 内 容 可 以 划分 为 两 种 , 即 控制 信息 的 传送 与 大 批量 数据 传送 。 有 时 ,也 把 进 
程 间 控制 信息 的 交换 称 为 低级 通信 ,而 把 进程 间 大 批量 数据 的 交换 称 为 高 级 通信 。3.5 
和 3.6 节 中 介绍 的 进程 间 互 斥 或 同步 也 是 使 用 锁 或 信号 量 进行 通信 来 实现 的 。 低 级 通信 一 
般 只 传送 一 个 或 几 个 字 节 的 信息 ,以 达到 控制 进程 执行 速度 的 作用 ;高 级 通信 则 要 传送 大 量 
数据 ,其 目的 不 是 为 了 控制 进程 的 执行 速度 ,而 是 为 了 交换 信息 。 


3.7.1 进程 的 通信 方式 


在 单机 系统 中 ,进程 间 通 信 可 分 为 4 种 形式 : 

(1) 主 从 式 ; 

(2) 会 话 式 ; 

(3) 消息 或 邮箱 机 制 ; 

(4) 共享 存储 区 方式 。 

主 从 式 (master/servant system) 通 信 系 统 的 主要 特点 如 下 : 

(1) 主 进程 可 自由 地 使 用 从 进程 的 资源 或 数据 。 

(2) 从 进程 的 动作 受 主 进程 的 控制 。 

(3) 主 进程 和 从 进程 的 关系 是 固定 的 。 

主 从 式 通 信 系 统 的 典型 例子 是 终端 控制 进程 和 终端 进程 。 

会 话 系统 (dialogue system) 中 ,通信 进程 双方 可 分 别称 为 使 用 进程 和 服务 进程 。 其 中 ， 
可 


使 用 进程 调用 服务 进程 提供 的 服务 。 它 们 具有 如 下 特点 : 

(1) 使 用 进程 在 使 用 服务 进程 所 提供 的 服务 之 前 ,必须 得 到 服务 进程 的 许可 。 

(2) 服务 进程 根据 使 用 进程 的 要 求 提供 服务 ,但 对 所 提供 服务 的 控制 由 服务 进程 自身 
完成 。 

(3) 使 用 进程 和 服务 进程 在 进行 通信 时 有 固定 连接 关系 。 

用 户 进 程 与 磁盘 管理 进程 之 间 的 通信 和 是 会 话 系统 的 一 个 例子 。 各 用 户 进 程 向 磁盘 管理 
进程 提出 使 用 要 求 并 得 到 许可 之 后 , 才 可 以 使 用 相应 的 存储 区 。 而 且 , 由 磁盘 管理 进程 自身 
完成 对 磁盘 存储 区 的 管理 和 控制 。 另 外 ,用 户 进程 与 磁盘 管理 进程 之 间 , 只 有 在 用 户 进程 要 
求 使 用 磁盘 存储 区 时 才 有 通信 关系 

消息 或 邮箱 机 制 则 无 论 接收 进程 是 否 已 准备 好 接收 消息 ,发 送 进程 都 将 把 所 要 发 送 的 
消息 送 入 缓冲 区 或 邮箱 。 这 里 ,消息 (message) 是 用 来 区 别 于 命令 (command) 或 指令 
(instruction) 等 用 语 的。 除了 表示 所 交换 的 数据 传递 大 量 信息 之 外 ,消息 还 具有 两 个 互相 
通信 的 进程 地 位 平等 的 意思 。 消 息 的 一 般 形 式 由 4 个 部 分 组 成 , 即 发 送 进程 名 、 接 收 进程 
名 ,数据 和 有 关 数 据 的 操作 ( 见 图 3. 16) 。 

消息 或 邮箱 机 制 的 特点 如 下 : 

(1) 只 要 存在 空 缓冲 区 或 邮箱 ,发 送 进程 就 可 以 发 送 消息 。 

(2) 与 会 话 系统 不 同 , 发 送 进程 和 接收 进程 之 间 无 直接 连接 关系 ,接收 进程 可 能 在 收 到 
某 个 发 送 进程 发 来 的 消息 之 后 ,又 转 去 接收 男 一 个 发 送 进程 发 来 的 消息 。 

(3) 发 送 进程 和 接收 进程 之 间 存 在 缓冲 区 或 邮箱 ( 见 图 3. 17) 用 来 存放 被 传送 消息 。 


缓冲 区 或 邮箱 
发 送 进程 名 | 接收 进程 名 | 操作 @)—L [LT 
图 3.16 消息 的 组 成 图 3.17 缓冲 区 或 邮箱 通信 结构 


与 前 面 3 种 方式 不 同 , 共 享 存储 区 方式 不 要 求 数据 移动 。 两 个 需要 互相 交换 信息 的 进 
程 通过 对 同一 共享 数据 区 (shared memory) 的 操作 来 达到 互相 通信 的 目的 。 这 个 共享 数据 
区 是 每 个 互相 通信 进程 的 一 个 组 成 部 分 。 

以 上 几 种 通信 方式 都 可 用 于 大 量 数据 传送 ,而 且 , 由 于 其 通信 方式 不 同 , 需 要 使 用 不 同 
的 控制 方式 来 达到 通信 进程 之 间 同 步 或 互 斥 的 目的 。 

下 面 ,首先 介绍 进程 通信 中 较为 常用 的 消息 与 邮箱 机 制 , 然 后 再 介绍 几 个 实际 例子 。 


3.7.2 消息 缓冲 机 制 


Hansen 在 1973 年 首先 提出 了 用 消息 缓冲 作为 进程 通信 的 一 种 基本 方式 。 发 送 进程 和 
接收 进程 采用 消息 缓冲 机 制 进行 数据 传送 时 ,发 送 进程 在 发 送 消息 前 , 先 在 自己 的 内 存 空 间 
设置 一 个 发 送 区 ,把 欲 发 送 的 消息 填 人 其 中 ,然后 再 用 发 送 过 程 将 其 发 送出 去 。 接 收 进 程 则 
在 接收 消息 之 前 ,在 自己 的 内 存 空间 内 设置 相应 的 接收 区 ,然后 用 接收 过 程 接 收 消息 。 由 于 
消息 缓冲 机 制 中 所 使 用 的 缓冲 区 为 公用 缓冲 区 ,使 用 消息 缓冲 机 制 传送 数据 时 ,两 个 通信 进 
程 必须 满足 如 下 条 件 : 

(1) 在 发 送 进程 把 消息 写 人 缓冲 区 和 把 缓冲 区 挂 入 消息 队列 时 ,应 禁止 其 他 进程 对 该 
缓冲 区 消息 队列 的 访问 。 否 则 ,将 引起 消息 队列 的 混乱 。 同 理 , 当 接收 进程 正 从 消息 队列 中 
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取消 息 缓冲 时 ,也 应 禁止 其 他 进程 对 该 队列 的 访问 。 

(2) 当 缓 冲 区 中 无 消息 存在 时 ,接收 进程 不 能 接收 到 任何 消息 。 

至 于 发 送 进程 是 否 可 以 发 送 消息 , 则 由 发 送 进程 是 否 申请 到 缓冲 区 决定 。 

设 公 用 信号 量 mutex 为 控制 对 缓冲 区 访问 的 互 斥 信号 量 , 其 初 值 为 1。 设 SM 为 接收 
进程 的 私 用 信号 量 ,表示 等 待 接收 的 消息 个 数 ,其 初 值 为 0。 设 发 送 进程 调用 过 程 Send(m) 
将 消息 m 送 往 缓冲 区 ,接收 进程 调用 过 程 Receive(m) 将 消息 m 从 缓冲 区 读 往 自己 的 数据 


区 , 则 Send(m) 和 ReceiveCn) 可 分 别 描述 为 


Send (m) : 
begin 
向 系统 申请 一 个 消息 缓冲 区 


P (mutex) 


将 发 送 区 消息 m 送 入 新 申请 的 消息 缓冲 区 
把 消息 缓冲 区 挂 入 接收 进程 的 消息 队列 


V (mutex) 
V (SM) 

end 

Receive (n) : 

begin 
P (SM) 
P (mutex) 
摘 下 消息 队列 中 的 消息 n 
将 消息 n 从 缓冲 区 复制 到 接收 区 
释放 缓冲 区 
V(mutex) 


end 


一 般 来 说 ,尽管 系统 中 可 利用 的 缓冲 区 总 数 是 已 知 的 ,但 由 于 消息 队列 是 按 接收 进程 排 
列 , 因 而 ,在 同一 时 间 内 ,系统 中 存在 着 多 个 消息 队列 ; 且 这 些 队列 的 长 度 是 不 固定 的 。 因 
此 ,发 送 进 程 无 法 在 Send 过 程 用 了 操作 判断 信号 量 SM。 


3.7.3 邮箱 通信 


邮箱 通信 就 是 由 发 送 进程 申请 建立 一 个 与 接收 进程 链接 的 邮箱 。 发 送 进程 把 消息 送 往 
邮箱 ,接收 进程 从 邮箱 中 取出 消息 ,从 而 完成 进程 间 的 信息 交换 。 设 置 邮箱 的 最 大 好 处 就 是 
发 送 进程 和 接收 进程 之 间 没 有 处 理 时 间 上 的 限制 。 一 个 邮箱 可 考虑 成 发 送 进程 与 接收 进程 
之 间 的 大 小 固定 的 私有 数据 结构 , 它 不 像 缓冲 区 那样 被 系统 内 所 有 进程 共享 。 邮 箱 由 邮箱 
头 和 邮箱 体 组 成 。 其 中 邮箱 头 描述 邮箱 名 称 .邮箱 大 小 .邮箱 方向 以 及 拥有 该 邮箱 的 进程 名 
等 。 邮 箱 体 主要 用 来 存放 消息 ( 见 图 3. 18) 。 


邮箱 头 


deposit(m) 


邮箱 体 


remove(m) /接收 
进程 


图 3.18 邮箱 通信 结构 
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邮箱 通信 的 特点 已 在 前 面 介绍 过 ,对 于 只 有 一 个 发 送 进 程 和 一 个 接收 进程 使 用 的 邮箱 ， 
则 进程 间 通 信 应 满足 如 下 条 件 : 

(1) 发 送 进程 发 送 消息 时 ,邮箱 中 至 少 要 有 一 个 空格 能 存放 该 消息 。 

(2) 接收 进程 接收 消息 时 ,邮箱 中 至 少 要 有 一 个 消息 存在 。 

设 发 送 进程 调用 过 程 deposit(m) 将 消息 发 送 到 邮箱 ,接收 进程 调用 过 程 remove(m) 将 
消息 m 从 邮箱 中 取出 。 另 外 ,为 了 记录 邮箱 中 空格 个 数 和 消息 个 数 , 信 号 量 fromnum 为 发 
送 进程 的 私 用 信和 号 量 , 信 号 量 mesnum 为 接收 进程 的 私 用 信和 号 量 。fromnum 的 初 值 为 信箱 
的 空格 数 n,mesnum 的 初 值 为 0。 则 deposit(m) 和 remove(m) 可 描述 如 下 : 


deposit (m) : 
begin local x 
P(fromnum) 
选择 空格 x 
将 消息 m 放 入 空格 x 中 
置 格 x 的 标志 为 满 
V (mesnum) 
end 
remove (m) : 
begin local x 
P (mesnum) 
选择 满 格 x 
把 满 格 x 中 的 消息 取出 放 入 m 中 
置 格 x 标志 为 空 
V(fromnum) 


end 


显然 ,调用 过 程 deposit(m) 的 进程 与 调用 过 程 remove(m) 的 进程 之 间 存在 着 同步 制约 
关系 而 不 是 互 斥 制约 关系 。 

另外 ,在 许多 时 候 , 存 在 着 多 个 发 送 进 程 和 多 个 接收 进程 共享 邮箱 的 情况 。 这 时 需要 对 
过 程 deposit(m) 和 remove(m) 作 相应 的 改动 。 


3.7.4 ”进程 通信 的 实例 一 一 和 控制 台 的 通信 


通用 计算 机 中 ,除了 用 户 终端 之 外 ,还 有 一 台 由 系统 操作 员 控 制 的 控制 台 终 端 。 各 用 户 
进程 可 将 消息 送 到 控制 台 进程 ,操作 员 在 读 到 这 些 消 息 后 做 出 相应 的 处 理 。 

设 控制 台 终 端 由 键盘 和 显示 器 组 成 ,终端 和 主机 之 间 按 全 双 工 模式 发 送 和 接收 数据 , 即 
键盘 和 数据 显示 彼此 独立 。 设 键盘 控制 进程 和 显示 控制 进程 分 别 为 KCP 和 DCP, 用 户 进 
程 和 控制 台 终 端的 通信 由 会 话 控制 进程 CCP 控制 完成 。 其 中 控制 台 键 盘 的 输入 放 入 缓冲 
队列 inbuf 中 ,CCP 可 从 inbuf 中 取出 消息 从 而 得 到 来 自控 制 台 的 指示 。 而 CCP 所 提出 的 
问题 则 以 消息 形式 放 入 控制 台 的 输出 缓冲 队列 outbuf 中 ,DCP 从 outbuf 中 取出 消息 送 至 
显示 器 ,以 供 操作 员 判 断 。 其 通信 过 程 如 图 3. 19 所 示 。 

下 面 , 先 描述 KCP 与 键盘 、DCP 与 显示 器 之 间 的 通信 动作 ,然后 描述 CCP 与 KCP 及 
DCP 的 接口 , 紧 接着 再 给 出 CCP 与 用 户 进程 的 接口 ,最 后 再 综合 描述 CCP 的 动作 。 
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ET ® 
四 昌 


制 | 王 -| echobuf CCP 


KCP 广 -一 inbuf 
| 


DCP: Display Control Process 
KCP: Keyboard Control Process 
CCP : Convesation Control Process 
Pi, P,,*…, P,: user processes 


图 3. 19 和 控制 台 通 信和 示例 


1. KCP 和 DCP 的 动作 
以 上 通信 过 程 是 一 个 严格 的 提问 /回答 方式 的 通信 例子 。 先 描述 KCP 和 DCP 的 动作 
(下 面 的 描述 中 省 略 了 进程 的 PCB 部 分 )。 
首先 , 当 操 作 员 按键 时 ,KCP 将 对 应 的 数据 从 键盘 送 入 输入 缓冲 inbuf 中 ,同时 ,也 将 输 
入 数据 送 echobuf 在 显示 器 上 显示 。 显 然 ,KCP 和 CCP 等 之 间 的 通信 满足 消息 机 制 的 条 
件 。 另 外 ,除了 KCP 和 CCP 的 通信 之 外 ,KCP 实际 上 还 在 和 键盘 发 生 通信 。 因 此 ,在 描述 
KCP 和 CCP 时 ,还 必须 考虑 KCP 和 键盘 的 通信 。 
KCP 可 描述 如 下 : 
键盘 控制 进程 KCP: 
设 T-Ready 和 T-Busy 分 别 为 键盘 动作 KP 和 键盘 控制 进程 KcP 的 私 用 信号 量 , 其 初 值 为 0 和 1 
初始 化 {清除 所 有 inbuf 和 echobuf} 
begin local x 
P(T-Ready) 
从 键盘 数据 传输 缓冲 x 中 取出 字符 m, 记 为 x.m 
Send (x.m) 
将 x.m 送 入 echobuf 
V(T-Busy) 


end 
这 里 ,假设 键盘 也 可 用 进程 描述 如 下 : 
键盘 动作 KP: 
repeat local x 
P(T-Busy) 
把 输入 字符 放 入 数据 传输 缓冲 x 
V(T-Ready) 
until 终端 关闭 
同样 ,可 以 写 出 DCP 和 显示 器 动作 DP 的 通信 动作 : 
显示 器 控制 进程 DCP: 


设 D-Ready 和 D-Busy 分 别 为 DP 和 DcP 的 私 用 信号 量 , 其 初 值 为 0 和 1 
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初始 化 {清除 输出 缓冲 outbuf,echo 模式 置 false} 
begin 
if outbuf 满 
then 
receive(k)/x* CCP kx / 
P(D-Busy) 
把 k 送 入 显示 器 数据 缓冲 区 
V(D-Ready) 
else 
echo 模式 置 true 
echobuf 中 字符 置 人 显示 器 数据 缓冲 区 
下 未 


显示 器 动作 DP: 


repeat 
if echo 模式 
then 
打印 显示 器 数据 缓冲 区 中 的 字符 
else 
P(D-Ready) 
打印 显示 器 数据 缓冲 区 中 的 消息 
V(D-Busy) 
来 
until 显示 器 关机 


这 里 ,假定 一 个 消息 的 长 度 总 是 小 于 outbuf 的 长 度 。 

2. CCP 和 KCP 及 DCP 的 接口 

上 面 已 经 描述 了 KCP 与 KP、DCP 与 DP 的 同步 动作 部 分 。 那 么 ,KCP、DCP 与 CCP 
之 间 又 是 如 何 动作 的 呢 ? 现在 来 看 CCP 怎样 从 inbuf 中 读 出 消息 和 怎样 把 消息 写 入 
outbuf。 这 里 ,仍然 假定 一 个 消息 的 长 度 小 于 outbuf 和 inbuf 的 长 度 。 

设 过 程 Read(x) 把 inbuf 中 的 所 有 字符 读 到 用 户 进程 数据 区 x 处 ,过 程 WriteCy) 把 用 
户 进 程 y 处 的 消息 写 到 outbuf 中 , 则 Read(x) 和 Write(y) 可 分 别 描述 如 下 : 


Read (x): 
begin 
P (inbuf-full) 
Copy (inbuf into x) 
V (inbuf-empty) 
end 
Write (y) : 
begin 
P (outbuf-empty) 
Copy (outbuf from y) 
V(outbuf- full) 


end 


这 里 ,inbuf-full 和 inbuf-empty 分 别 是 CCP 和 KCP 的 私 用 信号 量 , 在 过 程 Send(m) 和 
Read(x) 中 使 用 ,其 初 值 分 别 为 0 和 1。 由 于 在 KCP 中 ,Send(m) 被 用 来 将 字符 一 个 个 地 送 
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入 inbuf 中 ,Send(m) 过 程 必须 要 做 一 定 的 改动 ,也 就 是 要 加 入 缓冲 计数 功能 和 把 inbuf 的 
长 度 看 作 是 固定 的 。 关 于 Send(m) 的 修改 请 读者 自己 完成 。 另 外 ,outbuf-full 和 outbuf- 
empty 则 是 DCP 和 CCP 的 私 用 信号 量 ,在 过 程 receive(k) 和 Write(y) 中 使 用 ,其 初 值 分 别 
为 0 和 1。 由 于 outbuf 的 长 度 是 固定 的 ,所 以 receive(k) 过 程 也 应 作 相 应 的 修改 。receive(k) 的 
修改 也 请 读者 自己 完成 。 

3. CCP 与 用 户 进 程 的 接口 

除了 和 KCP 及 DCP 的 通信 之 外 .CCP 还 要 从 各 用 户 进 程 那里 得 到 提问 和 向 提问 的 用 
户 进程 转达 从 控制 台 来 的 指示 。 因 此 ,CCP 和 用 户 进程 之 间 也 存在 着 通信 关系 。 

设 各 用 户 进程 向 CCP 发 出 的 提问 用 消息 组 成 队列 RQ。 各 用 户 进 程 把 消息 送 入 RQ 时 
必须 互 斥 操作 ,否则 将 引起 RQ 队列 混乱 。 因 此 , 设 互 斥 用 信号 量 rq, 初 值 为 1。 另外 ,CCP 

只 有 在 用 户 进 程 提 问 之 后 才 负 责 向 控制 台 转 发 提问 和 向 用 户 进程 转达 控制 台 的 指示 。 因 

此 ,还 必须 为 CCP 设置 一 个 私 用 信号 量 question 以 计算 用 户 进 程 所 提出 的 问题 数目 。 信 和 号 
量 question 的 初 值 为 0。 另外 ,由 于 各 用 户 进程 在 CCP 发 出 回答 消息 之 后 ,不 一 定 马上 就 
能 处 理 CCP 所 发 出 的 回答 消息 ,因而 , 需 设 置 相应 的 消息 接收 队列 SQ;。SQ; 和 RQ 的 关系 
如 图 3. 20 所 示 。 


RQ 


Gk+1 | akg 


U_receive(m) 


S_answer(a,i) 


图 3.20 CCP 和 用 户 进程 接口 


与 对 RQ 队列 的 操作 相同 ,对 SQ; 队列 的 操作 也 必须 是 互 斥 的 ,因而 , 设 互 斥 信号 量 
ee tee 除 此 之 外 ,为 了 保证 CCP 和 各 用 户 进 程 之 间 获 得 回答 的 同步 ,还 需 设 一 
私 用 信号 量 answer; 以 计算 SQ; 中 的 消息 个 数 。 

CCP 和 用 户 进 程 的 接口 可 描述 如 下 : 


U- receive (m) : 
begin 
P (question) 
when rq do 从 RO 中 取出 mod 
return (m) 


end 
这 里 ,采用 了 互 斥 变量 rq 作为 临界 区 名 。U-receive(m) 描 述 从 RQ 取出 一 个 消息 的 过 程 


S-answer (a,i): 
begin 
when sdqi do 把 a 插入 so; 中 od 
V (answer:i) 


end 
4. CCP 的 动作 


作为 实现 用 户 进程 与 控制 台 通信 的 方法 之 一 ,利用 上 面 所 述 的 各 种 接口 ,可 以 描述 实现 
a 必 


严格 的 顺序 会 话 CCP 进程 。 
会 话 控制 进程 CCP: 
local k,m,x 
repeat 
U- receive (m) 
将 消息 m 的 进程 标号 置 人 kk 中 
将 消息 m 解 码 变换 到 x 
Write (x) 
Read (x) 
将 zx 编码 到 m 
S-answer (m, k) 


until CCP 结束 


3.7.5 ”进程 通信 的 实例 一 一 管道 


1. 管道 (pipe) 

进程 通信 的 实例 之 一 是 UNIX 系统 的 管道 通信 。 eg ,提供 有 
名 管道 和 无 名 管道 两 种 数据 通信 方式 ,这 里 介绍 无 名 管 

ee 
管道 在 迎 辑 上 被 看 作 管 道 文件 ,在 物理 上 则 由 文件 系统 的 高 速 缓冲 区 构成 ,而 很 少 启动 外 
设 。 发 送 进程 利用 文件 系统 的 系统 调用 write(fdLlj,buf,size) 把 buf 中 的 长 度 为 size 个 字 
符 的 消息 送 入 管道 人口 fdL1j] ,接收 进程 则 使 用 系统 调用 read(fdL0j,buf,size) 从 管道 出 口 
fdL0j 读 出 size 个 字符 的 消息 置 入 buf 中 。 这 里 ,管道 按 FIFO 方式 传送 消息 , 且 只 能 单 向 传 
送 消息 ( 见 图 3. 21) 。 


pipe[fd] 读 
fd0] Si fd[0]_ 出 
write (fd[1],buf,size) read(fd[0],buf,size) ” 端 


图 3.21 管道 通信 


尖峰 


利用 UNIX 提供 的 系统 调用 pipe 可 建立 一 条 同步 通信 管道 。 其 格式 为 


pipe (fd) 
int fal2]? 


这 里 ,fd[1] 为 写 人 端 ,fdL0 为 读 出 端 。 

2. 示例 

例 1: 用 CC 语言 编写 一 Weg 建立 一 个 管道 ,同时 父 进 程 生 成 一 个 子 进程 , 子 进程 向 
管道 中 写 入 一 个 字符 串 , 父 进程 从 管道 中 读 出 该 字符 串 。 

解 : 程序 如 下 : 


#include <stdio.h> 
main() 
下 
nt E21? 
:B63 


char buf [30],s[30]; 


pipe (fd); /创建 管道 * 
while( (x=fork())==-1); /* 创建 子 进程 失败 时 ,循环 * / 
if (x==0) 


{ 


sprintf (buf,"This is an example\n"); 


write (fd[1],buf, 30); /x 把 puf 中 的 字符 写 入 管道 * / 
exit (0); 

} 

else /x* 父 进程 返回 x / 

{ 
wait(0); 
read (fd[0],s,30); /* 父 进程 读 管道 中 的 字符 x / 


printf ("Ses", es)s? 


} 


例 2: 编写 一 个 程序 ,建立 一 个 管道 。 同 时 , 父 进程 生成 子 进 程 P 和 P; ,这 两 个 子 进程 
Pe 它们 (如 图 3. 22 所 示 )。 


@) fd[1] Pipe fd[0] 


图 3.22 父 进 程 和 子 进程 Pi 、P; 通信 


解 : 程序 框图 如 图 3. 23 所 示 , 源 程序 如 下 : 


#include <stdio.h> 
main() 
’ 
int rplp2r £012]; 
char buf [50],s[50]; 


pipe (fd); /* 父 进程 建立 管道 * / 
while( (pl=fork())==-1); /* 创建 子 进 程 Pp1, 失 败 时 循环 * / 
if (pl==0) /* 由 子 进程 Pl 返回 ,执行 子 进程 Pl x / 
{ 
lockf (fd[1],1,0); /加 锁 锁 定 写 入 端 * / 


sprintf (buf,"child process Pl is sending messages!\n"); 
printf ("child process Pl!\n"); 


write (fd[1],buf, 50); /* 把 buf 中 的 50 个 字符 写 人 管道 * 
sleep (5) /* 上 睡眠 5 秒 ,让 父 进程 读 * / 
lockf (fd[1],0,0); /释放 管道 写 和 人 端 * / 
exit (0); / 关 关 闭 Plx/ 
} 
else /* 从 父 进程 返回 ,执行 父 进程 * / 
{ 
while((p2=fork())==-1); /* 创建 子 进程 P2, 失败 时 循环 * / 


w 


if(p2==0) /x* 从 子 进程 P2 返回 ,执行 P2x / 
{ 

lockf (fd[1],1,0); /* 锁定 写 人 端 */ 

sprintf (buf,"child process P2 is sending messages!\n"); 


printf("child process P2 !\n"); 


write (fd[1],buf,50); /* 把 buf 中 的 字符 写 入 管道 * / 
sleep (5); /= 睡眠 等 待 * / 
lockf (fdq[1],0,0) /* 释放 管道 写 入 端 * / 
exit (0); /* 关 闭 P2*/ 
} 
wait(0); 


if (r=read(fd[0],s,50)==-1) 
printf("can't read pipe\n"); 

else printf("%$s\n",s); 

wait(0); 

if (r=read(fd[0],s,50)==-1) 
printf("can't read pipe\n"); 

else printf("%s\n",s); 


exit (0); 


创建 子 进程 P 


创建 子 进程 P> 
创建 成 功 ? 
是 


锁定 管道 写 端 写 消息 入 管道 
写 消息 入 管道 睡眠 等 待 父 进 程 读 消息 
! 六 
睡眠 等 待 父 进程 开锁 


[ER 
i 撤销 子 进程 P， 


撤销 子 进程 P 


读 取 管道 中 的 消息 放弃 处 理 机 


图 3.23 例 2 程序 流 图 
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其 中 ,lockf 为 保证 进程 互 斥 使 用 管道 的 系统 调用 ,sleep 为 保证 当前 进程 睡眠 以 转让 处 
理 机 的 系统 调用 。 


3.8 死 锁 问 题 


3.8.1 死 锁 的 概念 


1. 死 锁 的 定义 
各 进程 在 使 用 系统 资源 时 ,应 注意 系统 产生 死 锁 问题 。 所 谓 死 锁 ,是 指 各 并 发 进程 互相 
等 待 对方 所 拥有 的 资源 ' 旦 这 些 并 发 进程 在 得 到 对 方 的 资源 (Fr》 吏 s， 要 Rs,(@) 
之 前 不 会 释放 自己 所 拥有 的 资源 。 从 而 造成 大 家 都 想得到 人 、 一 
资源 而 又 都 得 不 到 资源 ,各 并 发 进程 不 能 继续 向 前 推进 的 状 | 和 >> 
态 。 图 3. 24 是 两 个 进程 发 生死 锁 时 的 例子 。 Sy 
下 面 以 生产 者 /消费 者 问题 为 例 来 进一步 看 看 死 锁 的 概 “[ Si 5 


念 。 设 生产 者 进程 已 获得 对 缓冲 区 队列 的 操作 权 , 生 产 者 进 图， 2 部 锁 的 村 人 

一 步 要 求 对 缓冲 区 内 的 某 一 空 缓冲 区 进行 先入 消息 操 
作 ; 然 而 , 设 此 时 缓冲 队列 内 所 有 缓冲 区 都 是 满 的 , 即 只 有 消费 者 进程 才能 对 它们 进行 取消 
息 操作 ,因此 ,生产 者 进程 进入 等 待 状态 。 反 过 来 ,消费 者 进程 拥有 对 各 缓冲 区 操作 的 操作 
权 ,为 了 对 各 缓冲 区 进行 操作 , 它 又 要 申请 对 缓冲 队列 操作 的 操作 权 ; 由 于 对 缓冲 队列 的 操 
作 权 被 生产 者 进程 掌握 , 且 生 产 者 进程 不 会 自动 释放 它 , 从 而 消费 者 进程 也 只 能 进入 等 待 状 
态 而 陷入 死 锁 。 

一 般 地 ,可 以 把 死 锁 描述 为 有 并 发 进程 Pi ,P;,…,P, ,它们 共享 资源 Ri ,Rs ，…，,Rn (7 
二 0,m 二 0,7 二 1) 。 其 中 ,每 个 P;(1 达 i 过 nn) 拥 有 资源 Ri (1 过 j 达 m) ,直到 不 再 有 剩余 资源 。 
同时 ,各 P; 又 在 不 释放 R; 的 前 提 下 要 求 得 到 Ri(k 隆 j ,1 三 k 壹 m) ,从 而 造成 资源 的 互相 占 
有 和 互相 等 待 。 在 没有 外 力 驱 动 的 情况 下 ,该 组 并 发 进程 停止 往 前 推进 , 陷 人 永久 等 待 

2. 死 锁 的 起 因 

死 锁 的 起 因 是 并 发 进程 的 资源 竞争 。 产 生死 锁 的 根本 原因 在 于 系统 提供 的 资源 个 数 少 
于 并 发 进程 所 要 求 的 该 类 资源 数 。 显 然 , 由 于 资源 的 有 限 性 ,不 可 能 为 所 有 要 求 资源 的 进程 
无 限制 地 提供 资源 。 但 是 ,可 以 采用 适当 的 资源 分 配 算法 ,以 达到 消除 死 锁 的 目的 。 为 此 ， 
先 看 看 产生 死 锁 的 必要 条 件 。 

3. 产生 死 锁 的 必要 条 件 

从 死 锁 的 概念 ,可 以 得 到 产生 死 锁 的 必要 条 件 如 下 : 

(1) 互 斥 条 件 。 并 发 进程 所 要 求 和 占有 的 资源 是 不 能 同时 被 两 个 以 上 进程 使 用 或 操作 
的 ,进程 对 它 所 需要 的 资源 进行 排他 性 控制 。 

(2) 不 剥夺 条 件 。 进 程 所 获得 的 资源 在 未 使 用 完毕 之 前 ,不 能 被 其 他 进程 强行 剥夺 , 而 
只 能 由 获得 该 资源 的 进程 自己 释放 。 

(3) 部 分 分 配 。 进 程 每 次 申请 它 所 需要 的 一 部 分 资源 ,在 等 待 新 资源 的 同时 ,继续 占用 
已 分 配 到 的 资源 。 

:0 


(4) 环 路 条 件 。 存 在 一 种 进程 循环 链 , 链 中 每 一 个 进程 已 获得 的 资源 同时 被 下 一 个 进 
ee 
然 , 只 要 使 上 述 4 个 必要 条 件 中 的 某 一 个 不 满足 , 死 锁 就 可 以 消除 。 


3.8.2 死 锁 的 消除 方法 


解决 死 锁 的 方法 一 般 可 分 为 预防 .避免 .检测 与 恢复 3 种 。 预 防 是 采用 某 种 策略 ,限制 
并 发 进程 对 资源 的 请 求 , 从 而 使 得 死 锁 的 必要 条 件 在 系统 执行 的 任何 时 间 都 不 满足 。 避 免 
是 指 系统 在 分 配 资源 时 ,根据 资源 的 使 用 情况 提前 做 出 预测 ,从 而 避免 死 锁 的 发 生 。 死 锁 检 
测 与 恢复 是 指 系统 设 有 专门 的 机 构 , 当 死 锁 发 生 时 ,该 机 构 能 够 检测 到 死 锁 发 生 的 位 置 和 原 
因 , 并 能 通过 外 力 破 坏死 锁 发 生 的 必要 条 件 , 从 而 使 得 并 发 进程 从 死 锁 状态 中 恢复 出 来 。 

一 般 而 言 , 由 于 操作 系统 的 并 行 与 共享 以 及 随机 性 等 特点 ,通过 预防 和 避免 的 手段 达到 
消除 死 锁 的 目的 是 一 件 十 分 困难 的 事 。 这 需要 较 大 的 系统 开销 ,甚至 不 能 充分 利用 资源 。 
死 锁 的 检测 和 恢复 则 与 此 相反 ,不必 花费 多 少 执行 时 间 就 能 发 现 死 锁 和 从 死 锁 中 恢复 出 来 。 
因此 ,在 实际 操作 系统 中 大 都 使 用 检测 与 恢复 法 消除 死 锁 。 

1. 死 锁 预防 

怎样 预防 死 锁 呢 ? 一 种 方法 是 打破 资源 的 互 斥 和 不 可 剥夺 这 两 个 条 件 , 例 如 允许 进程 
同时 访问 某 些 资 源 等 。 然 而 ,这 种 方法 不 能 解决 访问 那些 不 允许 被 同时 访问 的 资源 时 所 带 
来 的 死 锁 问题 ,比如 打印 机 等 。 另 一 种 方法 则 是 打破 资源 的 部 分 分 配 这 个 死 锁 产生 的 必要 
条 件 。 即 预先 分 配 各 并 发 进程 所 需要 的 全 部 资源 。 如 某 个 进程 的 资源 得 不 到 满足 时 , 则 安 
排 一 定 的 等 待 次 序 让 其 他 进程 释放 资源 。 但 是 ,这 种 方法 也 有 如 下 缺点 : 

(1) 在 许多 情况 下 ,一 个 进程 在 执行 之 前 不 可 能 提出 它 所 需要 的 全 部 资源 。 

(2) 无 论 所 需 资 源 何 时 用 到 ,一 个 进程 只 有 在 所 有 要 求 资源 都 得 到 满足 之 后 才 开 始 
执行 。 

(3) 对 于 那些 不 经 常 使 用 的 资源 ,进程 在 生存 过 程 期 间 一 直 占 用 它们 是 一 种 极 大 的 
浪费 。 

(4) 降低 了 进程 的 并 发 性 。 

另外 一 种 死 锁 的 预防 方法 是 打破 死 锁 的 环 路 条 件 。 即 把 资源 分 类 按 顺 序 排列 ,使 进程 
在 申请 、 保 持 资 源 时 不 形成 环 路 。 如 有 m 种 资源 , 则 列 出 Ri 过 Rs 二 … 二 R,,。 若 进程 P; 保 
持 了 资源 R;, 则 它 只 能 申请 比 R; 级 别 更 高 的 资源 Rj(R; 二 Rj; )。 释 放 资 源 时 必须 是 Ri 先 于 
R; 被 释放 ,从 而 避免 环 路 的 产生 。 这 种 方法 的 缺点 是 限制 了 进程 对 资源 的 请 求 ,而 且 对 资 
源 的 分 类 编 序 也 耗 去 一 定 的 系统 开销 。 

2. 死 锁 避免 

死 锁 避 免 可 被 称 为 动态 预防 ,因为 系统 采用 动态 分 配 资源 ,在 分 配 过 程 中 预测 出 死 锁 发 
生 的 可 能 性 并 加 以 避免 的 方法 。 

死 锁 避免 的 一 种 基本 模式 是 把 进程 分 为 多 个 步 , 其 中 每 个 步 所 使 用 的 资源 是 固定 的 , 且 
在 一 个 步 内 ,进程 所 保持 的 资源 数 不 变 。 即 进程 的 资源 请 求 、 使 用 与 释放 要 依靠 不 同 的 步 
完成 。 

设 并 发 进程 Pi ,Pi ,…,P, (n 宇 1) 共 享 不 同类 型 的 资源 Ri ,Rs ,…,R。 (7 之 1) ,每 一 R; 
有 固定 的 单元 数目 C;(1 志 i 过 n)。 系 统 按 一 定 的 资源 分 配 算法 给 各 进程 分 配 资源 。 
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可 用 一 个 向 量 矩 阵 过 多 :4 ,了 B ,下 盖 来 描述 各 进程 的 资源 请 求 和 获得 系统 空闲 资源 的 状 
况 。 其 中 ,W 二 Wi,W;,…,W,) 是 一 个 nXm 维 矩 阵 ,” 表 示 并 发 进程 数目 ,mm 表示 资源 类 
型 数目 ,Wi 二 wi()) 是 进程 P; 在 某 一 执行 步 时 为 完成 任务 请 求 追加 的 资源 Ri 的 单元 数目 。 
Wi 被 称 为 进程 P; 的 请 求 向 量 。4= (4 ,As，…,A,) 是 nXm ae 
分 配给 进程 P; 的 资源 Ri 的 单元 数 ,4; 被 称 为 分 配 向 量 。B 二 (Bi ,B;,…,B,) 是 nXm 维 释 
放 和 矩阵 ,By 二 6.(j) 是 进程 P; 释放 的 资源 Ri 的 单元 数 。 下 = ( 户 , 户 ,…, 廊 ) 是 空闲 资源 
向 量 。 

设 C=(ci,cs，…,cn) 为 系统 能 力 向 量 , 则 有 


即 Ri 类 资源 的 空闲 单元 数 是 总 单元 数 减 去 已 分 配给 各 进程 的 单元 数 。 
设 进程 P; 可 被 分 为 & 个 步 P;(1) ,P;(2) ,…,Pi(k) ,其 中 Pi(1) 为 初始 步 且 P;(&) 为 终止 
步 ,而 且 , 在 每 一 步 中 进程 保持 资源 和 请 求 资源 ,在 每 一 步 执 行 结束 后 进程 释放 资源 和 系统 
分 配 资源 。 若 对 于 P;(1),P;(2),…,P;(k) 有 
zi(1) <F 
且 


wi(r) SF+ bi()) 
j=1 


成 立 , 则 进程 P 在 结束 序列 中 。 如 果 所 有 并 发 进程 都 在 结束 序列 中 , 则 系统 是 安全 的 (无 死 
锁 )。 也 就 是 说 ,进程 的 请 求 向 量 不 能 大 于 空闲 资源 和 该 进程 准备 释放 的 资源 。 这 里 Wi;(7) 
表示 进程 P; 第 r 步 时 的 请 求 向 量 。 

显然 , 死 锁 回避 需要 占 去 系统 较 大 的 开销 。 

3. 死 锁 的 检测 和 恢复 

当 进 程 进行 资源 请 求 时 , 死 锁 检 测算 法 检查 并 发 进程 组 是 否 构成 资源 的 请 求 和 保持 环 
路 。 有 限 状 态 转 移 图 和 PetriNet 等 技术 都 可 用 来 有 效 地 判断 死 锁 发 生 。 死 锁 的 恢复 办 法 
较 多 ,最 简单 的 办 法 是 终止 各 锁 住 进程 ,或 按 一 定 的 顺序 中 止 进程 序列 ,直至 已 释放 到 有 足 
够 的 资源 来 完成 剩 下 的 进程 时 为 止 。 另 外 ,也 可 以 从 被 锁 住 进程 强迫 剥夺 资源 以 解除 死 锁 。 


3.9 线程 的 概念 


3.9.1 为 什么 要 引入 线程 


进程 是 为 了 提高 CPU 的 执行 效率 ,减少 因为 程序 等 待 带 来 的 CPU 空转 以 及 其 他 计算 
机 软 硬 件 资源 的 浪费 而 提出 来 的 。 进 程 是 为 了 完成 用 户 任 务 所 需要 的 程序 的 一 次 执行 过 程 
以 及 为 其 分 配 资源 的 一 个 基本 单位 。 以 进程 为 单位 来 分 配 资源 时 ， Wan 
统 要 定义 如 何 对 进程 进行 识别 和 操作 的 物理 实体 。 在 学 习 进程 管理 时 ,我 们 已 经 知道 ,这 个 
被 系统 识别 和 操作 的 物理 实体 就 是 进程 控制 块 (PCB)。PCB 负责 记录 进程 的 描述 信息 息 、 有 
关 控制 信息 、 各 种 资源 的 管理 信息 和 所 对 应 进程 的 CPU 现场 保护 信息 等 (执行 中 的 进 
除外 ) 。 

由 进程 管理 部 分 知道 ,在 网 络 或 多 用 户 环境 下 ,许多 用 户 的 应 用 任务 都 是 并 发 进行 的 ， 
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而 且 , 它 们 往往 只 有 较 多 的 软 硬 件 资源 。 在 引入 了 进程 的 概念 之 后 ,这 些 用 户 的 应 用 任务 都 
以 进程 的 方式 管理 ,执行 和 完成 。 

然而 ,在 许多 情况 下 ,用 户 所 要 完成 的 任务 具有 许多 相似 的 性 质 。 例 如 ,一 个 Web 服务 
器 可 以 同时 接收 来 自 不 同 用 户 的 网 页 访问 请 求 。 显 然 , 服 务 器 处 理 这 些 网 页 请 求 都 是 并 发 
进行 的 ,否则 ,将 会 造成 用 户 等 待 时 间 过 长 和 响应 时 间 降 低 。 

如 果 在 服务 器 中 用 进程 的 办 法 来 处 理 来 自 不 同 用 户 的 网 页 访问 请 求 的 话 ,我 们 可 以 用 
创建 父 进程 和 多 个 子 进程 的 方式 来 进行 处 理 。 

由 本 章 前 面 的 内 容 可 知 , 创 建 一 个 进程 要 花费 较 大 的 系统 开销 和 占用 较 多 的 资源 。 例 
如 ,至 少 要 消费 一 个 PCB 结构 。 如 果 这 个 进程 创建 的 子 进 程 过 多 (一 般 来 说 , 随 着 访问 服务 
器 的 用 户 数 增 加 , 子 进 程 数量 将 增加 ), 则 使 用 的 进程 PCB 结构 和 其 他 系统 资源 越 多 。 

显然 ,对 于 具有 不 确定 用 户 和 随机 访问 的 Web 服务 器 而 言 , 用 进程 来 管理 用 户 访 问 请 
求 的 方法 会 较 大 地 限制 开发 访问 服务 器 的 用 户 数 。 

另 一 方面 , 当 不 同 的 用 户 请 求 访 问 Web 服务 器 时 ,不 同 的 用 户 子 进 程 将 被 用 来 完成 访 
问 请 求 处 理 。 这 些 不 同 的 用 户 子 进程 的 执行 涉及 进程 的 上 下 文 切换 。 进 程 上 下 文 切换 是 一 
个 复杂 的 过 程 。 它 涉及 对 当前 正在 执行 进程 的 状态 和 占用 资源 的 保存 写 处 理 、 选 取 新 的 待 
执行 进程 以 及 恢复 待 执行 进程 的 执行 状态 和 资源 等 工作 。 

进程 的 创建 和 切换 过 程 越 多 ,系统 的 开销 就 越 大 ,从 而 ,服务 器 可 以 处 理 和 支持 的 用 户 
访问 请 求 就 会 越 少 。 显 然 , 如 何 减 少 进程 创建 和 切换 所 带 来 的 系统 开销 ,是 服务 器 操作 系统 
的 关键 问题 之 一 。 

类 似 的 例子 还 有 许多 ,例如 远程 过 程 调用 和 远程 数据 库 访问 等 。 

为 了 减少 进程 切换 和 创建 的 开销 ,提高 执行 效率 和 节省 资源 ,人 们 开始 在 操作 系统 中 引 
人 “线程 ”(thread) 的 概念 。 


3.9.2 线程 的 基本 概念 


线程 是 进程 的 一 部 分 。 
线程 有 时 又 被 称 为 轻 权 进程 或 轻 量 级 进程 (light weight process)。 
与 进程 相同 ,线程 也 是 CPU 调度 的 一 个 本 单位 。 


文 
一 个 没有 线程 的 进程 可 以 被 看 作 是 单线 程 的 , 即 进程 | ”| 等 人 器 
的 执行 过 程 是 线 状 的 ,尽管 中 间 会 发 生 中 断 或 暂停 ,但 该 堆栈 


进程 所 拥有 的 资源 只 为 该 线 状 执行 过 程 服务 。 一 旦 发 生 
进程 上 下 文 切 换 , 这 些 资源 都 是 要 被 保护 起 来 的 。 单 线程 
进程 的 概念 如 图 3. 25 所 示 。 

与 此 相对 应 ,如 果 在 一 个 进程 内 拥有 多 个 线程 , 则 进 
程 的 执行 过 程 不 再 是 唯一 线 状 的 , 它 由 多 条 线 状 执行 过 程 ”图 3.25 等 效 于 单线 程 的 进程 
组 成 ,如 图 3. 26 所 示 。 执行 示意 图 


3.9.3 线程 与 进程 的 区 别 


图 3. 25 和 图 3. 26 已 大 致 上 给 出 了 进程 和 线程 的 区 别 。 从 中 可 以 看 出 ,虽然 进程 和 线 
程 都 是 处 理 机 调度 的 基本 单位 ,但 是 ,线程 的 改变 只 代表 了 CPU 执行 过 程 的 改变 ,而 进程 
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一 一 一 执行 过 程 


PCB 文件 等 
寄存 器 、 堆 栈 | 寄存 器 、 堆 栈 | 寄存 器 、 堆 栈 | 寄存 器 、 堆 栈 


一 | “线程 


图 3.26 多 线程 情况 下 的 进程 执行 示意 图 


所 拥有 的 资源 没有 发 生变 化 。 或 者 说 ,除了 CPU 之 外 ,计算 机 内 的 软 硬 件 资源 的 分 配 与 线 
程 无 关 , 线 程 只 能 共享 它 所属 进 程 的 资源 。 

与 进程 控制 表 和 PCB 相似 ,每 个 线程 也 有 自己 的 线程 控制 块 (TCB) ,而 这 个 TCB 中 所 
保存 的 线程 状态 信息 则 要 比 PCB 少 得 多 ,这 些 信 息 主 要 是 相关 指针 用 堆栈 (系统 栈 和 用 户 
栈 ) 以 及 寄存 器 中 的 状态 数据 。 > 

进程 是 系统 中 所 有 资源 分 配 时 的 基本 单位 , 例 “| 六 名 纪 | | 站 | | 站 | | 
如 ,打印 机 等 设备 都 是 以 进程 为 单位 进行 分 配 的 。 PCB TCB |…| TCB, | …| TCB， 


进程 拥有 一 个 完整 的 虚拟 地 址 空间 (后 述 ) 。 。 [有 RD| | 堆栈 、| | 堆栈、 | 维权 、 
进程 不 依赖 于 线程 而 独立 存在 。 址 空间 | 。 | 过 存 器 | | 寄存 器 | | 寄存 器 
反之 ,线程 是 进程 的 一 部 分 , 它 没有 自己 的 地 。 | 上 线 租 1 。 线 租 ! 。 线 得 
址 空间 , 它 和 进程 内 的 其 他 进程 一 起 共享 分 配给 该 程序 、 数 据 与 文人 
进程 的 所 有 资源 。 进程 


多 线程 系统 中 进程 与 线程 的 关系 如 图 3. 27 图 3. 27 多 线程 与 进程 的 关系 
所 示 。 


3.9.4 线程 的 适用 范围 


尽管 线程 可 以 提高 系统 的 执行 效率 ,但 并 不 是 在 所 有 的 计算 机 系统 中 线程 都 是 适用 的 。 
事实 上 在 那些 很 少 做 进程 调度 和 切换 的 实时 系统 和 个 人 数字 助理 系统 中 ,由 于 任务 的 单一 
性 ,设置 线程 反而 会 占用 更 多 的 系统 资源 。 

使 用 线程 的 最 大 好 处 是 在 有 多 个 任务 需要 处 理 机 处 理 时 可 以 减少 处 理 机 的 切换 时 间 ; 
而 且 , 线 程 的 创建 和 结束 所 需要 的 系统 开销 也 比 进程 要 小 得 多 。 由 此 ,可 以 推出 最 适合 使 用 
线程 的 系统 是 多 处 理 机 系统 、 网 络 系 统 或 分 布 式 系统 。 在 多 处 理 机 系统 中 ,同一 用 户 程 序 可 
以 根据 不 同 的 功能 划分 为 不 同 的 线程 , 放 在 不 同 的 处 理 机 上 执行 。 在 网 络 或 分 布 式 系统 中 ， 
服务 器 可 对 多 个 不 同 用 户 的 请 求 按 不 同 的 线程 进行 处 理 ,从 而 提高 系统 的 处 理 速 度 和 效率 。 

在 用 户 程序 可 以 按 功能 划分 为 不 同 的 小 段 时 , 单 处 理 机 系统 也 可 因 使 用 线程 而 简化 程 
序 的 结构 和 提高 执行 效率 。 

下 面 是 几 种 典型 的 应 用 : 

(1) 服务 器 中 的 文件 管理 或 通信 控制 。 在 局 域 网 的 文件 服务 器 中 ,对 文件 的 访问 要 求 
可 被 服务 器 进程 派生 出 的 线程 进行 处 理 。 由 于 服务 器 同时 可 能 接受 许多 个 文件 访问 要 求 ， 
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则 系统 可 以 同时 生成 多 个 线程 来 进行 处 理 。 如 果 计 算 机 系统 是 多 处 理 机 的 ,这 些 线程 还 可 
以 安排 到 不 同 的 处 理 机 上 执行 。 

(2) 前 后 台 处 理 。 许 多 用 户 都 有 过 前 后 台 处 理 经验 , 即 把 一 个 计算 量 较 大 的 程序 或 实 
时 性 要 求 不 高 的 程序 安排 在 处 理 机 空闲 时 执行 。 对 于 同一 个 进程 中 的 上 述 程序 来 说 ,线程 
可 被 用 来 减少 处 理 机 切换 时 间 和 提高 执行 速度 。 例 如 ,在 表 处 理 进程 中 ,一 个 线程 可 被 用 来 
显示 菜单 和 读 取 用 户 输入 ,而 另 一 个 线程 则 可 用 来 执行 用 户 命令 和 修改 表格 。 由 于 用 户 输 
入 命令 和 命令 执行 分 别 由 不 同 的 线程 在 前 后 台 执 行 ,从 而 提高 了 操作 系统 的 效率 。 

(3) 异步 处 理 。 程 序 中 的 两 部 分 如 果 在 执行 上 没有 顺序 规定 , 则 这 两 部 分 程序 可 用 线 
程 执行 。 

另外 ,线程 方式 还 可 用 于 数据 的 批 处 理 以 及 网 络 系统 中 的 信息 发 送 与 接收 和 其 他 相关 
处 理 等 。 例 如 ,图 3. 28 给 出 了 一 个 用 户主 机 通过 网 络 对 两 台 远 程 服 务 器 进行 远程 调用 
(RPC) 以 获得 相应 结果 的 执行 情况 。 

如 果 用 户 程 序 只 用 一 个 线程 , 则 第 2 个 远程 调用 的 请 求 只 有 在 得 到 第 1 个 请 求 的 执行 
结果 后 才能 发 出 (如 图 3. 28(a) 所 示 )。 

多 线程 时 ,用户 程序 不 必 等 待 第 1 个 RPC 请 求 的 执行 结果 而 直接 发 出 第 2 个 RPC 请 
求 (如 图 3.28(b) 所 示 ), 从 而 缩短 等 待 时 间 。 
时 间 ”用 户 程序 服务 器 服务 器 2 


| 


上 


RPC 请求 1 1 
1 


时 间 “用户 程序 服务 器 1 服务 器 2 
线程 1 | | 


| 
RPC 请 求 11 
| 


结果 1 


RPC 请 求 2 


结果 2 


' 


— 
~ 
Er 


线程 阻塞 执行 


(a) 单线 程 时 的 RPC 请 求 处 理 (b) 多 线程 时 的 RPC 请 求 处 理 
图 3. 28 用 户 程序 向 两 台 远 程 服务 器 发 出 RPC 请 求 的 执行 结果 


3. 10 ”线程 分 类 与 执行 


3.10.1 线程 的 分 类 


线程 的 两 个 基本 类 型 是 用 户 级 线程 和 内 核 级 线程 (系统 级 线程 ) 。 在 同一 个 操作 系统 
中 ,有 的 使 用 纯 用 户 级 线程 ,有 的 使 用 纯 核 心 级 线程 ,例如 Windows NT 和 OS/2 就 是 这 样 
的 系统 ;有 的 则 混合 使 用 用 户 级 线程 和 核心 级 线程 ,例如 Solaris 操作 系统 。 
用 户 级 线程 (user-level thread) 的 管理 过 程 全 部 由 用 户 程序 完成 ,操作 系统 内 核 只 对 进 
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程 进行 管理 。 

为 了 对 用 户 级 线程 进行 管理 ,操作 系统 提供 一 个 在 用 户 空间 执行 的 线程 库 。 该 线程 库 
提供 创建 .调度 和 撤销 线程 功能 。 同 时 ,该 线程 库 也 提供 线程 间 的 通信 、 线 程 的 执行 以 及 存 
储 线程 上 下 文 的 功能 。 用 户 级 线程 只 使 用 户 堆栈 和 分 配给 所 属 进程 的 用 户 寄 存 器 。 当 一 
线程 被 派生 时 ,线程 库 为 其 生成 相应 的 线程 控制 块 (TCB) 等 数据 结构 ,并 为 TCB 中 的 参量 
赋值 和 把 该 线程 置 于 就 绪 状 态 。 其 处 理 过 程 与 进程 创建 过 程 大 致 相似 。 

这 两 个 过 程 不 同 的 是 : 

(1) 用 户 级 线程 的 调度 算法 和 调度 过 程 全 部 由 用 户 自行 选择 和 确定 ,与 操作 系统 内 核 
无 关 。 在 用 户 级 线程 系统 中 ,操作 系统 内 核 的 调度 单位 仍 是 进程 。 如 果 进 程 的 调度 区 间 为 

T, 则 在 工区 间 内 ,用 户 可 以 根据 自己 的 需要 设置 不 同 的 线程 调度 算法 。 

(2) 用 户 级 线程 的 调度 算法 只 进行 线程 上 下 文 切 换 而 不 进行 处 理 机 切换 , 且 其 线程 上 
下 文 切换 是 在 内 核 不 参与 的 情况 下 进行 的 。 也 就 是 说 ,线程 上 下 文 切换 只 是 在 用 户 栈 、 用 户 
寄存 器 等 之 间 进 行 , 不 涉及 处 理 机 的 状态 。 新 线程 通过 程序 调用 指针 的 变化 使 得 程序 计数 
器 变化 而 得 以 执行 。 

(3) 因为 用 户 级 线程 的 上 下 文 切换 与 内 核 无 关 , 所 以 可 能 出 现 如 下 情况 : 即 当 一 
程 由 于 1/O 中 断 或 时 间 片 用 完 等 原因 造成 该 进程 退出 处 理 机 ,而 属于 该 进程 的 执行 中 线程 
仍 处 于 执行 状态 。 也 就 是 说 ,尽管 相关 进程 的 状态 是 阻塞 的 或 等 待 的 ,但 所 属 线程 状态 却 是 
执行 的 。 

内 核 级 线程 (kernel-level thread) 由 操作 系统 内 核 进行 管理 。 操 作 系 统 内 核 给 应 用 程序 
提供 相应 的 系统 调用 和 应 用 程序 接口 (API) ,以 使 用 户 程 序 可 以 创建 ,执行 和 撤销 线程 。 

与 用 户 线程 不 同 , 内 核 级 线程 既 可 以 被 调度 到 一 个 处 理 机 上 并 发 执行 ,也 可 以 被 调度 到 
不 同 的 处 理 机 上 并 行 执 行 。 操 作 系统 内 核 既 负责 进程 的 调度 ,也 负责 进程 内 不 同 线程 的 调 
度 工作 。 因 此 ,内 核 级 线程 不 会 出 现 进程 处 于 阻塞 或 等 待 状态 ,而 线程 处 于 执行 状态 的 

另外, 内核 级 线程 技术 也 可 用 于 内 核 程 序 自身 ,从 而 提高 操作 系统 内 核 程序 的 执行 


效率 。 
内 核 级 线程 的 上 下 文 切 换 时 间 要 大 于 用 户 级 线程 的 上 下 文 切换 时 间 。 表 3. 1 给 出 了 用 
户 级 线程 ,内核 级 线程 以 及 进程 进行 上 下 文 切换 时 各 自 的 时 间 开 销 。 


表 3.1 线程 .进程 等 的 上 下 文 切换 开销 


操作 用 户 级 线程 内 核 极 线程 进程 
Null Fork 34 948 11 300 
信号 等 待 37 441 1840 


表 3.1 是 在 VAX 机 的 单 处 理 机 系统 上 用 UNIX 系列 操作 系统 测试 得 到 的 结果 。 测 试 
时 使 用 了 两 个 过 程 , 即 Null Fork 和 信号 等 待 (signal-wait)。 用 户 级 线程 ,内 核 级 线程 以 及 
进程 都 可 用 来 完成 上 述 功能 。 由 表 3. 1 可 以 看 出 ,用 户 级 线程 占用 的 系统 开销 最 小 ,内 核 级 
线程 的 开销 则 较 进 程 开 销 小 ,但 要 大 于 用 户 级 线程 的 开销 。 
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erg 用 户 级 线程 的 男 一 个 优点 是 : 实现 用 户 级 线程 不 需要 操作 系统 内 

核 的 特殊 支持 ,只 要 有 一 个 能 提供 线程 创建 调度、 执行 .撤销 以 及 通信 等 功能 的 线程 库 就 
行 了 。 

有 些 操作 系统 ,例如 Linux 或 Solaris 2. x, 提 供用 户 级 线程 和 系统 级 线程 两 种 功能 。 在 

这 些 操作 系统 中 ,线程 的 创建 、 le 间 完 成 ,而 这 些 线程 也 可 被 映射 到 

系统 空间 ,并 转化 为 内 核 级 线程 执行 。 这 与 后 述 的 UNIX 用 户 进程 以 及 系统 进程 有 相似 
之 处 。 


3.10.2 线程 的 执行 特性 


线程 在 执行 时 也 有 它 的 相关 特性 。 线 程 的 状态 和 同步 用 来 反映 线程 的 这 些 特性 。 

线程 有 3 个 基本 状态 , 即 执行 就绪 和 阻塞 。 但 是 线程 没有 进程 中 的 挂 起 状态 ,也 就 是 
说 ,线程 是 一 个 只 与 内 存 和 寄存 器 相关 的 概念 , 它 的 内 容 不 会 因 交换 而 进入 外 存 。 

针对 线程 的 3 种 基本 状态 ,存在 5 种 基本 操作 来 转换 线程 的 状态 。 这 5 种 基本 操作 
如 下 : 

(1) 派生 (Cspawn) 。 线 程 在 进程 内 派生 出 来 , 它 既 可 由 进程 派生 ,也 可 由 线程 派生 。 用 
户 一 般 用 系统 调用 (或 相应 的 库 函 数 ) 派 生 自己 的 线程 。 例 如 ,在 Linux 操作 系统 中 , 库 函 数 
clone() 和 Creatrthread() 被 分 别 用 来 派生 不 同 执行 模式 下 的 线程 。 

一 个 新 派生 出 来 的 线程 具有 相应 的 数据 结构 指针 和 变量 ,这 些 指针 和 变量 作为 寄存 器 

上 下 文 放 在 相应 的 寄存 器 和 堆栈 中 。 

新 派生 线程 被 放 人 就 绪 队 列 。 

(2) 阻塞 (block)。 如 果 一 个 线程 在 执行 过 程 中 需要 等 待 某 个 事件 发 生 , 则 被 阻塞 。 阻 
塞 时 ,寄存 器 上 下 文 ,程序 计数 器 以 及 堆栈 指针 都 会 得 到 保证 。 

(3) 激活 (unblock)。 如 果 阻 塞 线程 的 事件 发 生 , 则 该 线程 被 激活 并 进入 就 绪 队 列 。 

(4) 调度 (schedule)。 选 择 一 个 就 绪 线 程 进入 调度 
执行 状态 。 

(5) 结束 (finish)。 如 果 一 个 线程 执行 结束 ， 
它 的 寄存 器 上 下 文 以 及 堆栈 内 容 等 将 被 释放 。 

线程 的 状态 和 操作 关系 如 图 3. 29 所 示 。 

需要 注意 的 一 点 是 ,在 某 些 情况 下 , 某 个 线程 
被 阻塞 也 可 能 导致 该 线程 所 属 的 进程 被 阻塞 。 

线程 的 另 一 个 执行 特性 是 同步 。 

由 于 同一 进程 中 的 所 有 线程 共享 该 进程 的 所 有 资源 和 地 址 空间 ,任何 线程 对 资源 的 操 
作 都 会 对 其 他 相关 线程 带 来 影响 。 因 此 ,系统 必须 为 线程 的 执行 提供 同步 控制 机 制 , 以 防止 
因 线 程 的 执行 而 破坏 其 他 的 数据 结构 和 给 其 他 线程 带 来 不 利 的 影 

线程 中 所 使 用 的 同步 控制 机 制 与 进程 中 所 使 用 的 同步 控制 机 制 相 同 。 因 此 ,这 里 不 再 

一 步 讲述 有 关 线 程 的 同步 问题 。 


派生 


图 3.29 线程 的 状态 与 操作 
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本 章 小 结 


进程 是 操作 系统 中 最 重要 、 最 基本 的 概念 之 一 。 它 是 系统 分 配 资源 的 基本 单位 ,是 一 个 具 
有 独立 功能 的 程序 段 对 某 个 数据 集 的 一 次 执行 活动 。 引 入 进程 的 概念 是 由 操作 系统 的 资源 有 
限 性 处 理 上 的 并 行 性 以 及 系统 用 户 的 执行 起 始 时 间 的 随机 性 所 决定 的 。 一 切 仅 具 有 静态 特 
征 的 概念 ,例如 程序 ,不 能 反映 系统 的 上 述 特 征 ,因此 ,导入 了 具有 动态 特征 的 进程 概念 。 

进程 具有 动态 性 、 并 发 性 等 特点 。 反 映 进 程 动态 特性 的 是 进程 状态 的 变化 。 进 程 要 经 
历 创 建 、 等 待 资源 .就绪 准备 执行 、 执 行 和 执行 后 释放 资源 并 消亡 等 几 个 过 程 和 状态 。 进 程 
的 状态 转换 要 由 不 同 的 原 语 执行 完成 。 进 程 的 并 发 特性 反映 在 进程 对 资源 的 竞争 以 及 由 资 
源 竞 争 所 引起 的 对 进程 执行 速度 的 制约 。 这 种 制约 可 分 为 直接 制约 和 间接 制约 。 进 程 间 的 
直接 制约 是 被 制约 进程 和 制约 进程 之 间 存 在 着 使 用 对 方 资源 的 需求 ,只 有 制约 进程 执行 后 ， 
被 制约 进程 才能 继续 往 前 推进 。 进 程 间 的 间接 制约 是 被 制约 进程 共享 某 个 一 次 只 能 供 一 个 
进程 使 用 的 系统 资源 ,只 有 得 到 该 资源 的 进程 才能 继续 往 前 推进 ,其 他 进程 在 获得 资源 进程 
执行 期 间 不 允许 交叉 执行 。 因 此 ,直接 制约 进程 之 间 具 有 固定 的 执行 顺序 ,而 间接 制约 的 进 
程 之 间 则 没有 固定 的 执行 顺序 。 

进程 间 的 间接 制约 可 利用 加 锁 法 和 P、V 原 语 操作 实现 。 进 程 间 的 直接 制约 既 可 用 了 、 
V 原 语 实现 ,也 可 用 其 他 互相 传递 信号 的 方式 实现 。 

尽管 进程 是 一 个 动态 概念 ,但 是 ,从 处 理 机 执行 的 观点 来 看 ,进程 仍 需 要 静态 描述 。 一 
个 进程 的 静态 描述 是 处 理 机 的 一 个 执行 环境 ,被 称 为 进程 上 下 文 。 进 程 上 下 文 由 以 下 部 分 
组 成 : PCB( 进 程控 制 块 ) 、 正 文 段 和 数据 段 以 及 各 种 寄存 器 和 堆栈 中 的 值 。 寄 存 器 中 主要 
存放 将 要 执行 指令 的 逻辑 地 址 、 执 行 模式 以 及 执行 指令 时 所 要 用 到 的 各 种 调用 和 返回 参数 
等 。 而 堆栈 中 则 存放 CPU 现场 保护 信息 和 各 种 资源 控制 管理 信息 等 。 

本 章 中 所 述 的 另 一 个 重要 的 概念 是 进程 通信 。 进 程 通信 又 可 分 为 传送 控制 信号 的 低级 
通信 和 大 量 传送 数据 的 高 级 通信 。 从 通信 方式 来 看 ,又 可 分 为 主 从 式 、 会 话 式 、 消 息 与 邮箱 
方式 以 及 共享 虚 存 方式 。 

无 论 是 互相 通信 的 进程 或 是 共享 某 些 不 同类 型 资源 的 进程 ,都 可 能 因 通信 上 顺序 不 当 或 
资源 分 配 顺序 不 当 而 造成 死 锁 。 死 锁 是 一 种 因 各 并 发 进程 等 待 资 源 而 永久 不 能 向 前 推进 的 
系统 状态 。 死 锁 对 操作 系统 是 十 分 有 害 的 ,消除 死 锁 的 方法 是 预防 .回避 、 检 测 与 恢复 3 种 。 
比较 常用 的 死 锁 排除 方法 是 检测 与 恢复 方法 。 

线程 是 为 了 提高 操作 系统 的 执行 效率 而 引入 的 , 它 是 进程 内 的 一 段 程 序 的 基本 调度 单 
位 。 线 程 可 分 为 用 户 级 线程 和 内 核 级 线程 。 用 户 级 线程 的 管理 全 部 由 线程 库 完 成 ,与 操作 
系统 内 核 无 关 。 线 程 由 寄存 器 .堆栈 以 及 程序 计数 器 等 组 成 ,同一 进程 的 线程 共享 该 进程 的 
进程 空间 和 其 他 所 有 资源 。 线 程 主要 用 于 多 机 系统 以 及 网 络 系统 的 操作 系统 中 。 


习题 
3.1 有 人 说 ,一 个 进程 是 由 伪 处 理 机 执行 的 一 个 程序 ,这 话 对 吗 ? 为 什么 ? 


3.2 试 比较 进程 和 程序 的 区 别 。 
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我 们 说 程序 的 并 发 执行 将 导致 最 终结 果 失 去 封闭 性 。 这 话 对 所 有 的 程序 都 成 立 吗 ? 
试 举例 说 明 。 

试 比较 作业 和 进程 的 区 别 。 

UNIX System V 中 ,系统 程序 所 对 应 的 正文 段 未 被 考虑 成 进程 上 下 文 的 一 部 分 ,为 
什么 ? 

什么 是 临界 区 ? 试 举 一 个 临界 区 的 例子 。 

并 发 进程 间 的 制约 有 哪 两 种 ? 引起 制约 的 原因 是 什么 ? 

什么 是 进程 间 的 互 斥 ”什么 是 进程 间 的 同步 ? 

试 比 较 P、V 原 语 法 和 加 锁 法 实现 进程 间 互 斥 的 区 别 。 

设 在 3.6 节 中 所 描述 的 生产 者 -消费 者 问题 中 ,其 缓冲 部 分 由 m 个 长 度 相等 的 有 界 组 
冲 区 组 成 , 且 每 次 传输 数据 长 度 等 于 有 界 缓 冲 区 长 度 ,生产 者 和 消费 者 可 对 缓冲 区 
同时 操作 。 重 新 描述 发 送 过 程 deposit(data) 和 接收 过 程 remove( data)。 

两 个 进程 Ps 和 Ps 通过 两 个 FIFO 缓冲 区 队列 连接 (如 下 图 所 示 ), 每 个 缓冲 区 长 度 
等 于 传送 消息 长 度 。 进 程 PA 和 Ps 之 间 的 通信 满足 如 下 条 件 : 


_ 了 七 
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(1) 至 少 有 一 个 空 缓冲 区 存在 时 ,相应 的 发 送 进程 才能 发 送 一 个 消息 。 

(2) 当 缓冲 队列 中 至 少 存 在 一 个 非 空 缓冲 区 时 ,相应 的 接收 进程 才能 接收 一 个 消息 。 
试 描 述 发 送 过 程 send(i,m) 和 接收 过 程 receive(i,m)。 这 里 i 代表 缓冲 队列 。 

在 和 控制 台 通信 的 例子 中 , 设 操作 员 不 仅 回答 用 户 进 程 所 提出 的 问题 ,而 且 还 能 独立 
地 向 各 用 户 进程 发 出 指示 。 对 于 这 些 指 示 , 操 作 员 不 要 求 用 户 进程 回答 ,但 它们 享有 
比 其 他 消息 优先 传送 的 优先 度 。 即 如 果 inbuf 中 有 指示 存在 ,系统 不 能 进行 下 一 次 
通信 会 话 。 试 按 上 述 要 求 重新 描述 CCP、KCP 和 DCP。 

编写 一 个 程序 使 用 系统 调用 fork 生成 3 个 子 进程 ,并 使 用 系统 调用 pipe 创建 一 

道 , 使 得 这 3 个 子 进程 和 父 进程 公用 同一 管道 进行 信息 通信 。 

设 有 5 个 哲学 家 ,共享 一 张 放 有 5 把 椅子 的 桌子 ,每 人 分 得 一 把 椅子 。 但 是 ,桌子 上 
总 共 只 有 5 支 簧 子 ,在 每 人 两 边 分 开 各 放 一 支 。 哲 学 家 们 在 肚子 饥饿 时 才 试 图 分 两 
次 从 两 边 拾 起 簧 子 就 餐 。 条 件 如 下 : 

(1) 只 有 拿 到 两 支 簧 子 时 ,哲学 家 才能 吃饭 。 

(2) 如 果 簧 子 已 在 他 人 手 上 , 则 该 哲学 家 必须 等 待 到 他 人 吃 完 之 后 才能 拿 到 簧 子 。 
(3) 任 一 哲学 家 在 自己 未 拿 到 两 支 筑 子 吃饭 之 前 , 决 不 放下 自己 手中 的 簧 子 。 

试 解答 以 下 问题 ; 

(1) 描述 一 个 保证 不 会 出 现 两 个 邻 座 同 时 要 求 吃饭 的 通信 算法 。 

(2) 描述 一 个 既 没有 两 邻 座 同时 吃饭 ,又 没有 人 狐 死 (永远 拿 不 到 簧 子 ) 的 算法 。 

(3) 在 什么 情况 下 ,5 个 哲学 家 全 部 吃 不 上 饭 ? 

什么 是 线程 ” 试 述 线程 与 进程 的 区 别 。 

使 用 库 函 数 clone() 与 creat-thread() 在 Linux 环境 下 创建 两 种 不 同 执行 模式 的 线程 
程序 。 


Pa 
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第 4 章 处 理 机 调度 


CPU 是 计算 机 系统 中 十 分 重要 的 资源 。 但 在 早期 的 计算 机 系统 中 ,对 它 的 管理 是 十 分 
简单 的 。 因 为 那 时 它 和 其 他 系统 资源 一 样 ,为 一 个 作业 所 独占 ,不 存在 处 理 机 分 配 和 调度 问 
题 。 随 着 多 道 程序 设计 技术 和 各 种 不 同类 型 的 操作 系统 的 出 现 ,各 种 不 同 的 CPU 管理 方 
法 得 到 启用 。 不 同 的 CPU 管理 方法 将 为 用 户 提 供 不 同 性 能 的 操作 系统 。 例 如 ,在 多 道 批 
处 理 系统 中 ,为 了 提高 处 理 机 的 效率 和 增加 作业 吞吐 率 , 当 调度 一 批 作业 组 织 多 道 运 行 时 ， 
要 尽 可 能 使 作业 搭配 合理 ,充分 利用 系统 中 的 各 种 资源 。 在 分 时 系统 中 ,由 于 用 户 使 用 交互 
式 会 话 的 工作 方式 ,系统 必须 要 有 和 较 快 的 响应 时 间 ,使 得 每 个 用 户 都 感到 如 同 只 有 自己 一 人 
在 使 用 这 台 计 算 机 。 因 此 ,系统 在 调度 作业 执行 时 ,首先 考虑 的 是 每 个 用 户 作 业 得 到 处 理 机 
的 均等 性 。 在 实时 系统 中 ,首先 要 考虑 的 是 处 理 机 的 响应 时 间 。 由 此 可 见 ,操作 系统 的 要 求 
不 同 , 处 理 机 管理 的 策略 是 不 同 的 。 

衡量 调度 策略 的 指标 很 多 。 最 常用 的 几 个 指标 是 周转 时 间 吞吐 率 、 响 应 时 间 以 及 设备 
利用 率 等 。 

周转 时 间 是 指 将 一 个 作业 提交 给 计算 机 系统 后 到 该 作业 的 结果 返回 给 用 户 所 需要 的 
时 间 。 

否 吐 率 是 指 在 给 定 的 时 间 内 ,一 个 计算 机 系统 所 完成 的 总 工作 量 。 

响应 时 间 则 是 指 从 用 户 向 计算 机 发 出 一 个 命令 到 计算 机 把 相应 的 执行 结果 返回 给 用 户 
所 需要 的 时 间 。 

设备 利用 率 主要 指 输入 输出 设备 的 使 用 情况 ,在 有 些 要 求 /OO 处理 能 力 强 (如 管理 信 
息 系统 ) 的 系统 中 ,高 的 设备 利用 率 也 是 衡量 调度 策略 好 坏 的 一 个 重要 指标 。 

本 章 将 以 CPU 管理 为 核心 ,讨论 管理 和 控制 用 户 进程 执行 的 方法 。 主 要 包括 以 下 
内 容 : 

(1) 作业 与 进程 的 关系 ; 

(2) 作业 调度 策略 与 算法 ; 

(3) 进程 调度 策略 与 算法 ; 

(4) 几 种 调度 策略 的 评价 。 

另外 ,本 章 还 介绍 实时 调度 系统 。 


4.1 分 级 调度 


4.1.1 作业 的 状态 及 其 转换 


第 2 章 介 绍 了 作业 的 概念 。 作 业 是 用 户 要 求 计 算 机 所 做 的 关于 一 次 业务 处 理 的 全 部 工 

作 , 它 包括 作业 的 提交 、 执 行 和 输出 等 过 程 。 一 个 作业 从 用 户 提交 开始 到 占有 处 理 机 被 执 

行 ,要 由 系统 经 过 多 级 调度 才能 实现 (在 有 些 系统 ,例如 分 时 系统 中 ,也 可 以 由 单 级 调度 实 
:0 


现 )。 下 面 以 批 处 理 系 统 为 例 看 一 个 作业 处 理 的 大 致 过 程 。 
如 图 4. 1 所 示 ,一 个 作业 从 提交 给 计算 机 系统 到 执行 结束 退出 系统 ,一 般 都 要 经 历 提 
交 ,收容 .执行 和 完成 4 个 状态 。 


外 存 


[CS 
人 一 | 交换 调度 


输入 管理 系统 


进程 调度 作业 调度 
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图 4.1 作业 的 状态 及 其 转换 


一 个 作业 在 其 处 于 从 输入 设备 进入 外 部 存储 设备 的 过 程 称 为 提交 状态 。 处 于 提交 状态 
的 作业 , 因 其 信息 尚未 全 部 进入 系统 ,所 以 不 能 被 调度 程序 选取 。 

收容 状态 也 称 为 后 备 状态 。 输 入 管理 系统 不 断 地 将 作业 输入 到 外 存 中 的 对 应 部 分 (或 
称 输入 井 , 即 专门 用 来 存放 待 处 理 作业 信息 的 一 组 外 存 分 区 )。 若 一 个 作业 的 全 部 信息 已 全 
部 被 输入 进 输 入 井 , 那 么 ,在 它 还 未 被 调度 去 执行 之 前 ,该 作业 处 于 收容 状态 。 

作业 调度 程序 从 后 备 作业 中 选取 若干 个 作业 到 内 存 投 入 运行 。 它 为 被 选中 作业 建立 进 
程 并 分 配 必要 的 资源 ,这 时 ,这 些 被 选中 的 作业 处 于 执行 状态 。 从 宏观 上 看 ,这 些 作 业 正 处 
在 执行 过 程 中 ;但 从 微观 上 看 ,在 某 一 时 刻 , 由 于 处 理 机 总 数 少 于 并 发 执行 的 进程 数 , 因 此 ， 
不 是 所 有 被 选中 作业 都 占有 处 理 机 ,其 中 的 大 部 分 处 于 等 待 资源 或 就 绪 状 态 中 。 那 么 ,究竟 
哪个 作业 的 哪个 进程 能 获得 处 理 机 而 真正 在 执行 ,要 依靠 进程 调度 来 决定 。 

当 作业 运行 完毕 ,但 它 所 占用 的 资源 尚未 全 部 被 系统 回收 时 ,该 作业 处 于 完成 状态 。 在 
这 种 状态 下 ,系统 需 做 诸如 打印 结果 、 回 收 资源 等 善后 处 理工 作 。 


4.1.2 调度 的 层次 


处 理 机 调度 问题 实际 上 也 是 处 理 机 的 分 配 问 题 。 哪 些 作业 的 哪些 进程 可 以 参加 竞争 处 
理 机 呢 ? 显然 ,只 有 那些 参与 竞争 处 理 机 所 必需 的 资源 都 已 得 到 满足 的 进程 才能 享有 竞争 
处 理 机 的 资格 。 这 时 ,它们 处 于 内 存 就 绪 状 态 。 这 些 必需 的 资源 包括 内 存 、 外 设 及 有 关 数 据 
结构 等 。 从 而 ,在 进程 有 资格 竞争 处 理 机 之 前 ,作业 调度 程序 必须 先 调用 存储 管理 和 外 设 管 
理 程序 ,并 按 一 定 的 选择 顺序 和 策略 从 输入 井中 选择 出 几 个 处 于 后 备 状态 的 作业 ,为 它们 分 
配 内 存 等 资源 和 创建 进程 ,使 它们 获得 竞争 处 理 机 的 资格 。 

另外 ,由 于 处 于 执行 状态 下 的 作业 一 般 包含 多 个 进程 ,而 在 单机 系统 中 ,每 一 时 刻 只 能 
有 一 个 进程 占有 处 理 机 。 那 么 ,其 他 进程 就 只 能 处 于 准备 抢占 处 理 机 的 就 绪 状 态 或 等 待 得 
到 某 种 新 资源 的 等 待 状态 。 为 了 提高 资源 的 利用 率 , 在 有 些 操作 系统 中 把 一 部 分 在 内 存 中 
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处 于 就 绪 状 态 或 等 待 状态 而 在 短 时 期 内 又 得 不 到 执行 的 进程 .作业 换 出 内 存 , 以 让 其 他 作业 
的 进程 竞争 处 理 机 。 这 样 ,在 外 存 中 ,除了 处 于 后 备 状态 的 作业 外 ,还 存在 处 于 就 绪 状 态 而 
等 待 得 到 内 存 的 作业 。 这 就 需要 有 一 定 的 方法 和 策略 为 这 部 分 作业 分 配 空间 。 

一 般 来 说 ,处 理 机 调度 可 以 分 为 4 级 : 

(1) 作业 调度 。 又 称 宏观 调度 或 高 级 调度 。 其 主要 任务 是 按 一 定 的 原则 对 外 存 输入 井 
上 的 大 量 后 备 作业 进行 选择 ,给 选 出 的 作业 分 配 内 存 和 输入 输出 设备 等 必要 的 资源 ,并 建立 
相应 的 根 进程 ,以 使 该 作业 的 进程 获得 竞争 处 理 机 的 权利 。 另 外 , 当 该 作业 执行 完毕 时 ,还 
负责 回收 系统 资源 。 

(2) 交换 调度 。 又 称 中 级 调度 。 其 主要 任务 是 按照 给 定 的 原则 和 策略 ,将 处 于 外 存 交 
换 区 中 的 就 绪 状 态 或 等 待 状态 的 进程 调 入 内 存 , 或 把 处 于 内 存 就 绪 状 态 或 内 存 等 待 状态 的 
进程 交换 到 外 存 交 换 区 。 交 换 调度 主要 涉及 内 存 管理 与 扩充 ,因此 ,在 有 些 书 中 也 把 它 归 入 
内 存 管理 部 分 。 

(3) 进程 调度 。 又 称 微观 调度 或 低级 调度 。 其 主要 任务 是 按照 菜 种 策略 和 方法 选取 一 
个 处 于 就 绪 状 态 的 进程 占用 处 理 机 。 在 确定 了 占用 处 理 机 的 进程 之 后 ,系统 必须 进行 进程 
上 下 文 切换 以 建立 与 占用 处 理 机 进程 相 适 应 的 执行 环境 。 

(4) 线程 调度 。 上 述 4 级 调度 的 关系 如 图 4. 1 所 示 。 

在 多 道 批 处 理 系统 中 ,存在 着 作业 调度 和 进程 调度 。 但 是 ,在 分 时 系统 和 实时 系统 中 ， 
一 般 不 存在 作业 调度 ,而 只 有 进程 调度 、 交 换 调 度 和 线程 调度 。 这 是 因为 在 分 时 系统 和 实时 
系统 中 ,为 了 缩短 响应 时 间或 为 了 满足 用 户 需求 的 截止 时 间 , 作 业 不 是 建立 在 外 存 ， wi 
接 建 立 在 内 存 中 。 在 这 些 系 统 中 ,一 旦 用 户 和 系统 的 交互 开始 ,用 户 马 上 要 进行 控制 。 
而 ,这 些 系统 中 没有 作业 提交 状态 和 后 备 状态 。 ee 
接收 ,或 者 立即 处 理 ,或 者 经 交换 调度 暂 存 于 外 存 中 。 


4.1.3 作业 与 进程 的 关系 


作业 可 被 看 作 是 用 户 向 计算 机 提交 任务 的 任务 实体 ,例如 一 次 计算 和 一 个 控制 过 程 等 。 
反 过 来 ,进程 则 是 计算 机 为 了 完成 用 户 任务 而 设置 的 执行 实体 ,是 系统 分 配 资源 的 基本 单 
位 。 显 然 ,计算 机 要 完成 一 个 任务 实体 ,必须 要 有 一 个 以 上 的 执行 实体 。 也 就 是 说 ,一 个 作 
业 总 是 由 一 个 以 上 的 进程 组 成 。 

作业 怎样 分 解 为 进程 呢 ? 首先 ,系统 必须 为 一 个 作业 创建 一 个 根 进程 ;然后 ,在 执行 作 
业 控 制 语句 时 ,根据 任务 要 求 ,系统 或 根 进程 为 其 创建 相应 的 子 进 程 ;最 后 ,为 各 子 进 程 分 配 
资源 和 调度 各 子 进程 执行 以 完成 作业 要 求 的 任务 。 


4.2 作业 调度 


如 上 所 述 ,作业 调度 主要 是 完成 作业 从 后 备 状 态 到 执行 状态 的 转变 ,以 及 从 执行 状态 到 
完成 状态 的 转变 。 本 节 主 要 介绍 作业 调度 的 功能 及 调度 性 能 的 评价 方法 。 
4.2.1 作业 调度 功能 

作业 调度 有 以 下 主要 功能 。 
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(1) 记录 系统 中 各 作业 的 状况 ,包括 执行 阶段 的 有 关 情 况 。 通 常 , 系 统 为 每 个 作业 建立 
一 个 作业 控制 块 (JCB) 记 录 这 些 有 关 信息 。 与 系统 要 通过 进程 控制 块 (PCB) 感 知 进程 存在 
一 样 ,系统 通过 JCB 而 感知 作业 的 存在 。 系 统 在 作业 进入 后 备 状态 时 为 该 作业 建立 它 的 
JCB, 从 而 使 得 该 作业 可 被 作业 调度 程序 感知 。 当 该 作业 执行 完毕 进入 完成 状态 之 后 ,系统 
又 撤销 其 JCB 而 释放 有 关 资 源 并 撤销 该 作业 。 每 个 作业 在 各 阶段 所 


要 求 和 分 配 的 资源 以 及 该 作业 的 状态 都 记录 在 它 的 JCB 中 ,根据 JCB | 
中 的 有 关 信 息 ,作业 调度 程序 对 作业 进行 调度 和 管理 。 次 来 

对 于 不 同 的 批 处 理 系统 ,其 JCE 的 内 容 也 有 所 不 同 。 图 4.2 给 出 。 pp 
了 JCB 的 主要 内 容 。 它 包括 作业 各 ,作业 类 型 资源 要 求 当 前 状态 、 pp 
资源 使 用 情况 以 及 该 作业 的 优先 级 等。 

其 中 ,作业 名 由 用 户 提供 并 由 系统 将 其 转换 为 系统 可 识别 的 作业 | 状态 
标识 符 。 作 业 类 型 指 该 作业 属于 计算 型 (要 求 CPU 时 间 多 ) 还 是 管理 | 世人 


型 (要 求 输入 输出 量 大 ) ,或 图 形 设计 型 (要 求 高 速 图 形 显 示 ) 等 。 而 资 图 4.2 作业 控制 块 
源 要 求 则 包括 该 作业 估计 执行 时 间 、 要 求 的 最 迟 完 成 时 间 、 要 求 的 内 (JCB) 
存量 和 外 存量 、 要 求 的 外 设 类 型 及 台数 以 及 要 求 的 软件 支持 工具 库 函 
数 等 。 资 源 要 求 均 由 用 户 提 供 。 资 源 使 用 情况 包括 作业 进入 系统 时 间 、 开 始 执 行 时 间 \ 已 执 
行 时 间 、 内 存 地 址 和 外 设 台数 等 。 作 业 进 入 系统 时 间 指 作业 的 全 部 信息 进入 输入 井 ,作业 的 
状态 成 为 后 备 状态 的 时 间 。 开 始 执 行 时 间 指 该 作业 被 调度 程序 选中 ,其 状态 由 后 备 状态 变 
为 执行 状态 的 时 间 。 内 存 地 址 指 分 配给 该 作业 的 内 存 区 起 始 地 址 。 外 设 台 数 指 分 配给 该 作 
业 的 外 设 实际 台数 。 优 先 级 则 用 来 决定 该 作业 的 调度 次 序 。 优 先 级 既 可 以 由 用 户 给 定 , 也 
可 以 由 系统 动态 计算 产生 。 当 前 状态 是 指 该 作业 当前 所 处 的 状态 。 显 然 , 只 有 当 作业 处 于 
后 备 状 态 时 ,该 作业 才 可 以 被 调度 。 

(2) 从 后 备 队列 中 挑选 出 一 部 分 作业 投入 执行 。 一 般 来 说 ,系统 中 处 于 后 备 状态 的 作 
业 较 多 ,大 的 系统 可 以 达到 几 十 个 甚至 几 百 个 。 这 取决 于 输入 井 的 空间 大 小 。 但 是 ,处 于 执 
行 状 态 的 作业 一 般 只 有 有 限 的 几 个 。 作 业 调度 程序 根据 选 定 的 调度 算法 ,从 后 备 作 业 队 列 
中 挑选 出 若干 作业 去 投入 执行 。 

(3) 为 被 选中 作业 做 好 执行 前 的 准备 工作 。 作 业 调 度 程 序 为 选中 的 作业 建立 相应 的 进 
程 , 并 为 这 些 进 程 分 配 它 们 所 需要 的 系统 资源 ,如 分 配给 它们 内 存 、 外 存 和 外 设 等 。 

(4) 在 作业 执行 结束 时 做 善后 处 理工 作 。 主 要 是 输出 作业 管理 信息 ,例如 执行 时 间 等 。 
再 就 是 回收 该 作业 所 占用 的 资源 ,撤销 与 该 作业 有 关 的 全 部 进程 和 该 作业 的 作业 控制 块 等 。 

作业 从 后 备 状态 到 执行 状态 ,又 从 执行 状态 到 完成 状态 的 转换 过 程 如 图 4. 3 所 示 。 


4.2.2 作业 调度 目标 与 性 能 衡量 


现在 已 经 知道 ,作业 调度 的 功能 是 : 记录 系统 中 各 作业 的 状况 ;从 后 备 作 业 队 列 中 挑选 
一 批 作业 进入 执行 状态 ;为 被 选中 作业 分 配 资源 建立 进程 ,并 在 作业 执行 结束 后 释放 所 占用 
的 资源 等 。 其 中 最 主要 的 是 从 后 备 作 业 队 列 中 选取 一 批 作业 进入 执行 状态 。 怎 样 挑选 呢 ? 
显然 ,根据 不 同 的 目标 ,会 有 不 同 的 调度 算法 。 这 些 调度 算法 将 在 4.4 节 中 介绍 ,这 里 先 介 
绍 调度 目标 。 
一 般 来 说 ,调度 目标 主要 是 以 下 4 点 : 
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(a) 作业 从 后 备 状态 到 执行 状态 (b) 作业 从 执行 状态 到 完成 状态 


图 4.3 作业 调度 中 状态 的 转换 过 程 


(1) 对 所 有 作业 应 该 是 公平 合理 的 。 

(2) 应 使 设备 有 高 的 利用 率 。 

(3) 每 天 执行 尽 可 能 多 的 作业 。 

(4) 有 快 的 响应 时 间 。 

由 于 这 些 目 标的 相互 冲突 , 任 一 调度 算法 要 想 同 时 满足 上 述 目 标 是 不 可 能 的 。 例 如 ,要 
想 执行 尽 可 能 多 的 作业 ,调度 算法 就 应 选择 那些 估计 执行 时 间 短 的 作业 ,但 这 样 做 对 那些 估 
计 执 行 时 间 长 的 作业 又 是 不 公平 的 ,使 它们 的 响应 时 间 将 会 变 得 非常 长 。 

必须 指出 ,如 果 考 虑 的 因素 过 多 ,调度 算法 就 会 变 得 非常 复杂 。 其 结果 是 系统 开销 增 
加 ,资源 利用 率 下 降 。 因 此 ,大 多 数 操作 系统 都 根据 用 户 需 要 ,采用 兼顾 某 些 目 标的 简单 调 
度 算法 。 

那么 ,怎样 来 衡量 一 个 作业 调度 算法 是 否 满足 系统 设计 的 要 求 呢 ? 对 于 批 处 理 系统 ,由 
于 主要 用 于 计算 ,对 于 作业 的 周转 时 间 要 求 较 高 。 因 此 ,作业 的 平均 周转 时 间或 平均 带 权 周 
转 时 间 被 作为 衡量 调度 算法 优 劣 的 标准 。 但 是 ,对 于 分 时 系统 和 实时 系统 来 说 ,另外 增加 了 
平均 响应 时 间作 为 衡量 调度 策略 优 劣 的 标准 。 

1. 周转 时 间 

作业 i 的 周转 时 间 工 ; 为 
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了 
其 中 Te; 为 作业 i 的 完成 时 间 ,Ts: 为 作业 的 提交 时 间 。 
对 于 被 测定 作业 流 所 含有 的 n(n 三) 个 作业 来 说 ,其 平均 周转 时 间 为 


着 三 人 去 
一 个 作业 的 周转 时 间 说 明了 该 作业 在 系统 内 停留 的 时 间 ,包含 两 部 分 : 一 为 等 待 时 间 , 二 为 
执行 时 间 , 即 
Ti = To; 十 Tri 

这 里 , Tw; 主要 指 作 业 i 由 后 备 状态 到 执行 状态 的 等 待 时 间 , 它 不 包括 作业 进入 执行 状态 后 
的 等 待 时 间 。 

2. 带 权 周转 时 间 

作业 的 周转 时 间 包 含 了 两 个 部 分 , 即 等 待 时 间 和 执行 时 间 。 为 了 进一步 反映 调度 性 能 ， 
引入 了 带 权 周转 时 间 的 概念 。 带 权 周 转 时 间 是 作业 周转 时 间 与 作业 执行 时 间 的 比 : 


Wi = T/T 
对 于 被 测定 作业 流 所 含有 的 几 个 作业 来 说 ,其 平均 带 权 周转 时 间 为 
3 
W= pr 


对 于 分 时 系统 ,除了 要 保证 系统 吞吐 量 大 、 资 源 利用 率 高 之 外 ,还 应 保证 有 用 户 能 够 容 
忍 的 响应 时 间 。 因 此 ,在 分 时 系统 中 ,仅仅 用 周转 时 间或 带 权 周 转 时 间 来 衡量 调度 性 能 是 不 
够 的 。 


4.3 进程 调度 


无 论 是 在 批 处 理 系 统 、 分 时 系统 还 是 实时 系统 中 ,用 户 进程 数 一 般 都 多 于 处 理 机 数 , 这 
将 导致 用 户 进程 互相 争夺 处 理 机 。 另 外 ,系统 进程 也 同样 需要 使 用 处 理 机 。 这 就 要 求 进 程 
调度 程序 按 一 定 的 策略 ,动态 地 把 处 理 机 分 配给 处 于 就 绪 队 列 中 的 某 一 个 进程 ,以 使 之 执 
行 。 本 节 介 绍 进程 调度 的 功能 和 进程 调度 发 生 的 时 机 等 。 


4.3.1 进程 调度 的 功能 


进程 调度 的 具体 功能 可 总 结 如 下 : 

(1) 记录 系统 中 所 有 进程 的 执行 情况 。 

作为 进程 调度 的 准备 ,进程 管理 模块 必须 将 系统 中 各 进程 的 执行 情况 和 状态 特征 记录 
在 各 进程 的 PCB 中 ,并 且 ,进程 管理 模式 根据 各 进程 的 状态 特征 和 资源 需求 ,将 各 进程 的 
PCB 排 成 相应 的 队列 并 进行 动态 队列 转 接 。 进 程 调度 模块 通过 PCB 变化 来 掌握 系统 中 所 
有 进程 的 执行 情况 和 状态 特征 ,并 在 适当 的 时 机 从 就 绪 队 列 中 选择 出 一 个 进程 占据 处 理 机 。 

(2) 选择 占有 处 理 机 的 进程 。 

进程 调度 的 主要 功能 是 按照 一 定 的 策略 选择 一 个 处 于 就 绪 状 态 的 进程 ,使 其 获得 处 理 
机 执行 。 根 据 不 同 的 系统 设计 目的 ,有 各 种 各 样 的 选择 策略 ,例如 系统 开销 较 小 的 静态 优先 
数 调 度 法 ,适用 于 分 时 系统 的 轮转 法 (round robin) 和 多 级 反馈 轮转 法 (round robin with 
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multiple feedback) 等 。 这 些 选 择 策略 决定 了 调度 算法 的 性 能 。 有 关 这 些 算 法 ,将 在 4.5 节 
中 描述 。 

(3) 进行 进程 上 下 文 切换 。 

当 正 在 执行 的 进程 由 于 某 种 原因 要 让 出 处 理 机 时 ,系统 要 做 进程 上 下 文 切换 ,以 使 被 调 
度 选中 的 进程 得 以 执行 。 被 选中 进程 必须 从 上 一 次 被 中 断 处 开始 执行 。 这 就 要 恢复 该 进程 
的 上 下 文 和 进行 上 下 文 切换 ,系统 在 做 上 下 文 切换 时 ,首先 要 检查 是 否 可 以 做 上 下 文 切换 
(在 有 些 情况 下 ,上 下 文 切换 是 不 允许 的 ,例如 系统 正在 执行 某 个 不 允许 中 断 的 原 语 时 ) 。 然 
后 ,系统 要 保留 有 关 被 切换 进程 的 足够 信息 ,以 便 以 后 切换 回 该 进程 时 顺利 恢复 该 进程 的 执 
行 。 在 系统 保留 了 CPU 现场 之 后 ,调度 程序 选择 一 个 新 的 处 于 就 绪 状 态 的 进程 ,并 装配 成 
该 进程 的 上 下 文 ,使 CPU 的 控制 权 转 换 到 被 选中 进程 中 。 


4.3.2 进程 调度 的 时 机 


进程 调度 发 生 在 什么 时 机 呢 ? 这 与 引起 进程 调度 的 原因 以 及 进程 调度 的 方式 有 关 。 

引起 进程 调度 的 原因 有 以 下 几 类 : 

(1) 正在 执行 的 进程 执行 完毕 。 这 时 ,如 果 不 选择 新 的 就 绪 进程 执行 ,将 浪费 处 理 机 

(2) 执行 中 进程 自己 调用 阻塞 原 语 将 自己 阻塞 起 来 进入 睡眠 等 待 状态 。 

(3) 执行 中 进程 调用 了 P 原 语 操作 ,从 而 因 资 源 不 足 而 被 阻塞 ;或 调用 了 V 原 语 操作 
激活 了 等 待 资 源 的 进程 队列 。 

(4) 执行 中 进程 提出 1/O 请 求 后 被 阻塞 。 

(5) 在 分 时 系统 中 时 间 片 已 经 用 完 。 

(6) 在 执行 完 系统 调用 ,在 系统 程序 返回 用 户 进程 时 ,可 认为 系统 进程 执行 完毕 ,从 而 
可 调度 选择 一 个 新 的 用 户 进程 执行 。 

以 上 都 是 在 CPU 执行 不 可 剥夺 方式 下 所 引起 进程 调度 的 原因 。 在 CPU 执行 方式 是 
可 剥夺 时 ,还 有 以 下 的 原因 : 

(7) 就 绪 队 列 中 的 某 进程 的 优先 级 变 得 高 于 当前 执行 进程 的 优先 级 ,从 而 也 将 引发 进 
程 调度 。 

所 谓 可 剥夺 方式 , 即 就 绪 队 列 中 一 旦 有 优先 级 高 于 当前 执行 进程 优先 级 的 进程 存在 时 ， 
便 立 即 发 生 进 程 调度 ,转让 处 理 机 。 而 非 剥 夺 方 式 或 不 可 剥夺 方式 意味 着 : 即使 在 就 绪 队 
列 存在 有 优先 级 高 于 当前 执行 进程 时 ,当前 进程 仍 将 继续 占有 处 理 机 ,直到 该 进程 自己 因 调 
用 原 语 操作 或 等 待 1/O 而 进入 阻塞 .睡眠 状态 ,或 时 间 片 用 完 时 才 重 新 发 生 调度 让 出 处 
理 机 。 

操作 系统 将 在 以 上 几 种 原因 之 一 发 生 的 情况 下 进行 进程 调度 。 例 如 ,UNIX System V 
就 是 在 以 下 5 种 情况 之 一 发 生 时 进行 进程 调度 的 : 

(1) 当前 进程 自己 调用 sleep 和 wait 等 进入 睡眠 状态 时 。 

(2) 当前 进程 从 系统 调用 执行 结束 后 返回 用 户 态 时 , 它 的 优先 级 已 低 于 其 他 就 绪 状 态 
进程 ,或 调度 标志 被 置 位 。 

(3) 当前 进程 在 完成 中 断 和 陷阱 处 理 后 返回 用 户 态 时 , 它 的 优先 级 已 低 于 其 他 就 绪 状 
态 进 程 ,或 调度 标志 被 置 位 。 
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(4) 时 间 片 用 完 , 而 且 当 前 进程 的 优先 级 低 于 其 他 就 绪 进 程 。 
(5) 当前 进程 调用 exit 自我 终止 时 。 


4.3.3 进程 调度 性 能 评价 


进程 调度 虽然 是 系统 内 部 的 低级 调度 ,但 进程 调度 的 优 劣 直接 影响 作业 调度 的 性 能 。 
那么 ,怎样 评价 进程 调度 的 优 劣 呢 ? 反映 作业 调度 优 劣 的 周转 时 间 和 平均 周转 时 间 只 在 某 
种 程度 上 反映 了 进程 调度 的 性 能 ,例如 ,其 执行 时 间 部 分 中 实际 上 包含 有 进程 等 待 ( 包 括 就 
绪 状 态 时 的 等 待 ) 时 间 ,而 进程 等 待 时 间 的 多 少 是 要 依靠 进程 调度 策略 和 等 待 事件 何 时 发 生 
来 决定 的 。 因 此 ,进程 调度 性 能 的 衡量 是 操作 系统 设计 的 一 个 重要 指标 。 

进程 调度 性 能 的 衡量 方法 可 分 为 定性 和 定量 两 种 。 在 定性 衡量 方面 ,首先 是 调度 的 可 
靠 性 。 包 括 一 次 进程 调度 是 否 可 能 引起 数据 结构 的 破坏 等 。 这 要 求 对 调度 时 机 的 选择 和 保 
存 CPU 现场 十 分 谨慎 。 另 外 ,简洁 性 也 是 衡量 进程 调度 的 一 个 重要 指标 ,由 于 调度 程序 的 
执行 涉及 多 个 进程 和 必须 进行 上 下 文 切 换 , 如 果 调 度 程序 过 于 烦琐 和 复杂 ,将 会 耗 去 较 大 的 
系统 开销 。 这 在 用 户 进程 调用 系统 调用 较 多 的 情况 下 ,将 会 造成 响应 时 间 大 幅度 增加 。 

进程 调度 的 定量 评价 包括 CPU 的 利用 率 评价 、 进 程 在 就 绪 队 列 中 的 等 待 时 间 与 执行 
时 间 之 比 等 。 实 际 上 ,由 于 进程 进入 就 绪 队 列 的 随机 模型 很 难 确定 ,而 且 进 程 上 下 文 切换 等 
也 将 影响 进程 的 执行 效率 ,从 而 对 进程 调度 进行 解析 是 很 困难 的 。 一 般 情况 下 ,大 多 利用 模 
拟 或 测试 系统 响应 时 间 的 方法 来 评价 进程 调度 的 性 能 。 


4.4 调度 算法 


本 节 讨 论 各 种 常用 的 进程 调度 算法 和 作业 调度 算法 。 

1. 先 来 先 服务 (FCFS) 调 度 算法 

将 用 户 作 业 和 就 绪 进 程 按 提交 顺序 或 变 为 就 绪 状态 的 先后 排 成 队列 ,并 按照 先 来 先 服 
务 (First Come First Serve,FCFS) 的 方式 进行 调度 处 理 , 是 一 种 最 普遍 和 最 简单 的 方法 。 
在 没有 特殊 理由 要 优先 调度 某 类 作业 或 进程 时 ,从 处 理 的 角度 来 看 ,FCFS 方式 是 一 种 最 合 
适 的 方法 ,因为 无 论 是 追加 还 是 取出 一 个 队列 元 素 在 操作 上 都 是 最 简单 的 。 

直观 看 ,该 算法 在 一 般 意义 下 是 公平 的 。 即 每 个 作业 或 进程 都 按照 它们 在 队列 中 等 待 
的 时 间 长 短 来 决定 它们 是 否 优先 享受 服务 。 不 过 对 于 那些 执行 时 间 较 短 的 作业 或 进程 来 
说 ,如 果 它 们 在 某 些 执行 时 间 很 长 的 作业 或 进程 之 后 到 达 , 则 它们 将 等 待 很 长 的 时 间 。 

在 实际 的 操作 系统 中 ,尽管 很 少 单独 使 用 FCFS 算法 ,但 和 其 他 一 些 算法 配合 起 来 ， 
FCFS 算法 还 是 使 用 得 相当 多 的 。 例 如 ,基于 优先 级 的 调度 算法 就 是 对 具有 同样 优先 级 的 
作业 或 进程 采用 的 FCFS 方式 。 

2. 轮转 法 (round robin) 

轮转 法 的 基本 思路 是 让 每 个 进程 在 就 绪 队 列 中 的 等 待 时 间 与 享受 服务 的 时 间 成 比例 。 
轮转 法 的 基本 概念 是 将 CPU 的 处 理 时 间 分 成 固定 大 小 的 时 间 片 。 如 果 一 个 进程 在 被 调度 
选中 之 后 用 完了 系统 规定 的 时 间 片 ,但 未 完成 要 求 的 任务 , 则 它 自行 释放 自己 所 占有 的 
CPU 而 排 到 就 绪 队 列 的 末尾 ,等 待 下 一 次 调度 。 同 时 ,进程 调度 程序 又 去 调度 当前 就 绪 队 
列 中 的 第 一 个 进程 或 作业 。 轮 转 法 的 原理 见 图 4. 4。 
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图 4.4 轮转 法 调度 


显然 ,轮转 法 只 能 用 来 调度 分 配 那些 可 以 抢占 的 资源 。 将 它们 随时 剥 夺 再 分 配给 别 的 
进程 。CPU 是 可 抢占 资源 的 一 种 。 但 如 打印 机 等 资源 是 不 可 抢占 的 。 由 于 作业 调度 是 对 
除了 CPU 之 外 的 所 有 系统 硬件 资源 的 分 配 , 其 中 包含 了 不 可 抢占 资源 ,所 以 作业 调度 不 使 
用 轮转 法 。 

在 轮转 法 中 ,时 间 片 长 度 的 选取 非常 重要 。 首 先 , 时 间 片 长 度 的 选择 会 直接 影响 系统 开 
销 和 响应 时 间 。 如 果 时 间 片 长 度 过 短 , 则 调度 程序 剥夺 处 理 机 的 次 数 增多 ,这 将 使 进程 上 下 
文 切 换 次 数 也 大 大 增加 ,从 而 加 重 系统 开销 。 反 过 来 ,如 果 时 间 片 长 度 选择 过 长 ,比方 说 一 
个 时 间 片 能 保证 就 绪 队 列 中 所 需 执 行 时 间 最 长 的 进程 能 执行 完毕 , 则 轮转 法 变 成 了 先 来 先 
服务 法 。 

时 间 片 长 度 gq 的 选择 是 根据 系统 对 响应 时 间 的 要 求 R 和 就 绪 队 列 中 所 允许 的 最 大 进 
程 数 Ni 确定 的 。 它 可 表示 为 

q = R/Nix 

在 g 为 常数 的 情况 下 ,如 果 就 绪 队 列 中 的 进程 数 发 生 远 小 于 Ns 的 变化 , 则 响应 时 间 R 
看 上 去 会 大 大 减 小 。 但 是 ,就 系统 开销 来 说 ,由 于 gq 值 固定 ,从 而 进程 上 下 文 切 换 的 时 机 不 
变 , 系 统 开销 也 不 变 。 通 常 ,系统 开销 也 是 处 理 机 执行 时 间 的 一 部 分 。CPU 的 整个 执行 时 
间 等 于 各 进程 执行 时 间 加 上 系统 开销 。 在 进程 执行 时 间 大 幅度 减少 的 情况 下 ,如 果 系 统 开 
销 也 随 之 减少 的 话 ,系统 的 响应 时 间 有 可 能 更 好 一 点 。 例 如 ,在 一 个 用 户 进 程 的 情况 下 ,如 
果 g 值 增 大 到 足够 该 进程 执行 完毕 的 话 , 则 进程 调度 所 引起 的 系统 开销 就 没有 了 。 一 种 可 
行 的 办 法 是 ,每 当 一 轮 调度 开始 时 ,系统 便 根 据 就 绪 队 列 中 已 有 进程 数目 计算 一 次 g 值 , 作 
为 新 一 轮 调度 的 时 间 片 长 度 。 这 种 方法 得 到 的 时 间 片 是 随 就 绪 队 列 中 的 进程 数 变化 的 。 

3. 多 级 反馈 轮转 法 (round robin with multiple feedback) 

在 轮转 法 中 ,加 入 到 就 绪 队 列 的 进程 有 3 种 情况 ,一 种 是 分 给 它 的 时 间 片 用 完 , 但 进程 
还 未 完成 , 回 到 就 绪 队 列 的 末尾 等 待 下 次 调度 再 继续 执行 。 第 二 种 情况 是 分 给 该 进程 的 时 
间 片 并 未 用 完 , 只 是 因为 请 求 W/O 或 由 于 进程 的 互 斥 与 同步 关系 而 被 阻塞 。 当 阻塞 解除 之 
后 再 回 到 就 绪 队 列 。 第 三 种 情况 就 是 新 创建 进程 进入 就 绪 队 列 。 如 果 对 这 3 种 进程 区 别 对 
待 ,给 予 不 同 的 优先 级 和 时 间 片 ,从 直观 上 看 ,可 望 进一步 改善 系统 服务 质量 和 效率 。 例 如 ， 
可 按照 进程 到 达 就 绪 队 列 的 类 型 和 进程 被 阻塞 时 的 阻塞 原因 分 成 不 同 的 就 绪 队 列 ,每 个 队 
列 按 FCFS 原则 排列 ,各 队列 之 间 的 进程 享有 不 同 的 优先 级 ,但 同一 队列 内 优先 级 相同 。 这 
样 , 当 一 个 进程 在 执行 完 它 的 时 间 片 ,或 从 睡眠 中 被 唤醒 以 及 被 创建 之 后 ,将 进入 不 同 的 就 
绪 队 列 。 多 级 反馈 轮转 法 与 优先 级 法 在 原理 上 的 区 别 是 ,一 个 进程 在 执行 结束 之 前 ,可 能 需 
要 反复 多 次 通过 反馈 循环 执行 ,而 不 是 优先 级 法 中 的 一 次 执行 。 

4. 优先 级 法 

优先 级 法 可 被 用 作 作 业 或 进程 的 调度 策略 。 系 统 或 用 户 首先 按 某 种 原则 为 作业 或 进程 
指定 一 个 优先 级 来 表示 该 作业 或 进程 所 享有 的 调度 优先 权 。 该 算法 的 核心 是 确定 进程 或 作 
业 的 优先 级 。 

二 


确定 优先 级 的 方法 可 分 为 两 类 , 即 静 态 法 和 动态 法 。 静 态 法 根据 作业 或 进程 的 静态 特 
性 ,在 作业 或 进程 开始 执行 之 前 就 确定 它们 的 优先 级 ,一旦 开始 执行 之 后 就 不 能 改变 。 动 态 
法 则 不 然 , 它 把 作业 或 进程 的 静态 特性 和 动态 特性 结合 起 来 确定 作业 或 进程 的 优先 级 , 随 着 
作业 或 进程 的 执行 过 程 ,其 优先 级 不 断 变化 。 

1) 静态 优先 级 

作业 调度 中 的 静态 优先 级 大 多 按 以 下 原则 确定 : 

(1) 由 用 户 自己 根据 作业 的 紧急 程度 输入 一 个 适当 的 优先 级 。 为 防止 各 用 户 都 将 自己 
的 作业 冠 以 高 优先 级 ,系统 应 对 高 优先 级 用 户 收 取 较 高 的 费用 。 

(2) 由 系统 或 操作 员 根 据 作 业 类 型 指定 优先 级 。 作 业 类 型 一 般 由 用 户 约 定 或 由 操作 员 
指定 。 例 如 ,可 将 作业 分 为 

。1/O 繁忙 的 作业 ; 

。 CPU 繁忙 的 作业 ; 

。1/0O 与 CPU 均衡 的 作业 ; 

。 一般 作业 ,等 等 。 

系统 或 操作 员 可 以 给 每 类 作业 指定 不 同 的 优先 级 。 

(3) 系统 根据 作业 要 求 资源 情况 确定 优先 级 。 例 如 ,根据 估计 所 需 处 理 机 时 间 、 内 存 大 
小 .I/O 设备 类 型 及 数量 等 确定 作业 的 优先 级 。 

进程 的 静态 优先 级 确定 可 以 采用 以 下 原则 : 

(1) 按 进程 的 类 型 给 予 不 同 的 优先 级 。 例 如 ,在 有 些 系 统 中 ,进程 被 划分 为 系统 进程 和 
用 户 进程 。 系 统 进 程 享 有 比 用 户 进 程 高 的 优先 级 。 对 于 用 户 进 程 来 说 , 则 可 以 分 为 

。 I/O 繁忙 的 进程 ; 

。 CPU 繁忙 的 进程 ; 

。I/O 与 CPU 均衡 的 进程 ; 

。 其 他 进程 。 

对 系统 进程 ,也 可 以 根据 其 所 要 完成 的 功能 划分 为 不 同 的 类 型 ,例如 调度 进程 .W/O 进 
程 . 中 断 处 理 进程 和 存储 管理 进程 等 。 这 些 进程 还 可 进一步 划分 为 不 同类 型 和 赋予 不 同 的 
优先 级 。 例 如 ,在 操作 系统 中 ,对 于 键盘 中 断 的 处 理 优 先 级 和 对 于 电源 掉 电 中 断 的 处 理 优先 
级 是 不 相同 的 。 

(2) 将 作业 的 静态 优先 级 作为 它 所 属 进程 的 优先 级 。 

2) 动态 优先 级 

基于 静态 优先 级 的 调度 算法 实现 简单 ,系统 开销 小 ,但 由 于 静态 优先 级 一 旦 确定 之 后 ， 
直到 执行 结束 为 止 始 终 保持 不 变 , 从 而 系统 效率 较 低 , 调 度 性 能 不 高 。 现 在 的 操作 系统 中 ， 
如 果 使 用 优先 级 调度 的 话 , 则 大 多 采用 动态 优先 级 的 调度 策略 。 

进程 的 动态 优先 级 一 般 根据 以 下 原则 确定 : 

(1) 根据 进程 占有 CPU 时 间 的 长 短 来 决定 。 一 个 进程 占有 处 理 机 的 时 间 越 长 , 则 在 被 
阻塞 之 后 再 次 获得 调度 的 优先 级 就 越 低 ,反之 ,其 获得 调度 的 可 能 性 就 会 越 大 。 

(2) 根据 就 绪 进 程 等 待 CPU 的 时 间 长 短 来 决定 。 一 个 就 绪 进 程 在 就 绪 队 列 中 等 待 的 
时 间 越 长 , 则 它 获 得 调度 的 优先 级 就 越 高 。 

由 于 动态 优先 级 随时 间 的 推移 而 变化 ,系统 要 经 常 计算 各 进程 的 优先 级 ,因此 ,系统 要 
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为 此 付出 一 定 的 开销 。 

下 面 介绍 线性 优先 级 调度 策略 (Selfish Round Robin,SRR)。 

使 用 轮转 法 调度 进程 时 ,新 创建 的 进程 也 放 和 就绪 队 列 末尾 享受 平等 的 处 理 机 时 间 片 。 
这 对 于 执行 时 间 长 的 进程 来 说 是 有 点 不 公平 的 ,因为 它们 需要 多 个 时 间 片 才能 完成 。 因 此 , 线 
性 优先 级 调度 策略 采用 如 下 方式 , 即 新 创建 的 进程 按 FCFS 方式 排 成 就 绪 队 列 , 而 其 他 已 得 到 
过 时 间 片 服务 的 进程 也 按 FCFS 方式 排 成 另 一 个 就 绪 队 列 或 称 享受 服务 队列 ( 见 图 4. 5)。 


享受 服务 进程 队列 | 
| 人 在 二 
3 | 1 
方 站 站 GT | 当 Pi 的 优先 级 等 于 
二 一 上 忆 的 优先 级 时 


图 4.5 线性 优先 级 调度 


对 于 这 两 个 不 同 队 列 中 的 进程 , 设 新 创建 进程 就 绪 队 列 中 进程 的 优先 级 已 以 
P=axt (a>0) 
的 速率 增加 。 另 外 ,享受 服务 队列 中 进程 的 优先 级 P 以 
P=bxt (a>b>0) 
的 速率 增长 。 设 某 一 进程 在 时 刻 时 被 创建 ,在 时 刻 t 时 ,该 进程 的 优先 级 为 
P(t) =ax(t—t) (ht<) 
又 设 该 进程 在 如 时 刻 转 人 享受 服务 队列 , 则 在 时 刻 上 ,该 进程 的 优先 级 变 为 
P(t) =ax (ti—h)+obx*(t—t) (Hit<t) 

那么 ,一 个 新 创建 进程 等 待 多 长 时 间 之 后 进入 享受 服务 队列 较为 合适 呢 ? 当 新 创建 进程 就 
绪 队列 中 的 头 一 个 进程 的 优先 级 已 GO) 一 ax (1 一 1) Pa 
与 享受 服务 队列 中 最 后 一 个 就 绪 进 程 的 优先 级 
P(7) 二 bxt 相等 时 ,新 创建 进程 队列 中 的 头 一 个 进 
程 可 以 转 入 享受 服务 进程 队列 。 其 优先 级 变化 曲线 
如 图 4.6 所 示 。 

另外 , 当 享 受 服务 进程 队列 为 空 时 ,新 创建 进程 
队列 的 头 一 个 进程 也 将 移 人 享受 服务 进程 队列 。 

显然 ,在 上 述 线性 优先 级 调度 法 中 ,a 之 b>0 的 人 
条 件 是 必要 的 。 否则, 当 5b>a 二 0 时 ,两 个 不 同 队列 
中 的 就 绪 态 进程 的 优先 级 将 永远 不 会 相等 ,从 而 ,在 享受 服务 进程 队列 中 永远 只 有 一 个 进 
程 。 因 此 ,上 述 线性 优先 级 调度 策略 退回 到 FCFS 方式 。 另 外 ,如 果 ec 之 2=0, 则 线性 优先 
级 调度 策略 退回 到 轮转 法 调度 方式 。 事 实 上 ,线性 优先 级 调度 策略 是 一 种 介 于 轮转 法 和 
FCFS 方式 之 间 的 调度 策略 。 这 几 种 方式 的 调度 性 能 ,将 在 4. 5 节 中 更 进一步 讨论 。 

5. 最 短 作业 优先 法 (Shortest Job First,SJF) 

在 批 处 理 为 主 的 系统 中 ,如 果 采 用 FCFS 方式 进程 作业 调度 ,虽然 系统 开销 小 ,算法 简 
单 ,但 是 ,如 果 估计 执行 时 间 很 短 的 作业 是 在 那些 长 作业 的 后 面 到 达 系 统 的 话 , 则 必须 等 待 
长 作业 执行 完成 之 后 才 有 机 会 获得 执行 。 这 将 造成 不 必要 的 等 待 和 某 种 不 公平 。 最 短 作 业 
优先 法 (SJF) 就 是 选择 那些 估计 需要 执行 时 间 最 短 的 作业 投入 执行 ,为 它们 创建 进程 和 分 
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配 资 源 。 直 观 上 来 说 ,采用 最 短 作 业 优 先 的 调度 算法 ,可 使 得 系统 在 同一 时 间 内 处 理 的 作业 
个 数 最 多 ,从 而 吞吐 量 也 就 大 于 其 他 调度 方式 。 但 是 ,对 于 一 个 不 断 有 作业 进入 的 批 处理 系 
统 来 说 ,最 短 作 业 优先 法 有 可 能 使 得 那些 长 作业 永远 得 不 到 调度 执行 的 机 会 。 

6. 最 高 响应 比 优先 法 (Highest Response-ratio Next,HRN) 

最 高 响应 比 优先 法 是 对 FCFS 方式 和 SJF 方式 的 一 种 综合 平衡 。FCFS 方式 只 考虑 每 
个 作业 的 等 待 时 间 而 未 考虑 执行 时 间 的 长 短 , 而 SJF 方式 只 考虑 执行 时 间 而 未 考虑 等 待 时 
间 的 长 短 , 因 此 ,这 两 种 调度 算法 在 某 些 极端 情况 下 会 带 来 某 些 不 便 。HRN 调度 策略 同时 
考虑 每 个 作业 的 等 待 时 间 长 得 和 估计 需要 的 执行 时 间 长 得, 从 中 选 出 响应 比 最 高 的 作业 投 
入 执行 。 

响应 比 尺 定义 如 下 : 

R= (W+TD/T=1+W/T 

其 中 代为 该 作业 估计 需要 的 执行 时 间 ,W 为 作业 在 后 备 状态 队列 中 的 等 待 时 间 。 

每 当 要 进行 作业 调度 时 ,系统 计算 每 个 作业 的 响应 比 ,选择 其 中 R 最 大 者 投入 执行 。 
这 样 ,即使 是 长 作业 , 随 着 它 等 待 时 间 的 增加 ,W/T 也 就 随 着 增加 ,也 就 有 机 会 获得 调度 执 
行 。 这 种 算法 是 介 于 FCFS 和 SJF 之 间 的 一 种 折 中 算法 。 由 于 长 作业 也 有 机 会 投入 运行 ， 
在 同一 时 间 内 处 理 的 作业 数 显 然 要 少 于 SJF 法 ,从 而 采用 HRN 方式 时 其 吞吐 量 将 小 于 采 
用 SJF 法 时 的 吞吐 量 。 另 外 ,由 于 每 次 调度 前 要 计算 响应 比 , 系 统 开销 也 要 相应 增加 。 


4.5 算法 评价 


4.4 节 中 介绍 了 几 种 常用 的 作业 和 进程 调度 算法 以 及 响应 的 调度 性 能 衡量 标准 。 本 节 
主要 利用 解析 技术 从 数学 上 分 析 几 种 主要 调度 方法 的 性 能 。 


4.5.1 FCFS 方式 的 调度 性 能 分 析 


设 处 理 机 或 系统 资源 为 服务 器 ,一 个 进程 或 一 个 作业 为 享受 该 服务 器 服务 的 顾客 。 这 
些 顾客 按 FCFS 方式 排队 享受 服务 的 系统 模型 如 图 4. 7 FCFS 方 式 等 待 队 列 
所 示 。 se | 

这 里 ,假定 该 系统 模型 中 只 有 一 个 服务 器 S。 一 一 一 一 一 

设 新 顾客 到 达 等 待 队列 的 时 间 与 系统 的 当前 状态 .以 “图 上 7 FCFS 方 式 的 评价 模型 
前 的 顾客 到 达 时 间 都 无 关 ,也 就 是 新 顾客 到 达 系 统 的 时 间 
是 服从 泊 松 分 布 的 。 设 ) 为 到 达 率 , 则 在 单位 时 间 内 xz 个 顾客 到 达 的 概率 为 

Ptr) = Ee WM/z! 

单位 时 间 内 顾客 到 达 的 期 望 值 , 即 算术 平均 值 为 


Ee) = aP(ah = DN/ DI = er BP = 
z=0 z=1 y=0 
由 于 
SX! = 
工 一 0 


所 以 ,ECz) 一 人。 
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也 就 是 说 ,单位 时 间 内 顾客 到 达 的 平均 值 等 于 其 到 达 率 。 
设 服务 器 S 为 顾客 提供 服务 的 概率 也 服从 泊 松 分 布 , 且 w 为 服务 率 , 则 单位 时 间 内 工 
个 顾客 被 服务 的 概率 是 
PCz) = ery’/zr! 
同 理 ,单位 时 间 内 被 服务 顾客 个 数 的 算术 平均 值 等 于 其 服务 率 jy。 
将 单位 时 间 换 成 任意 时 间 1, 可 得 到 在 已 知 时 间 7 内 zz 个 顾客 到 达 的 概率 为 
P(z(1)) = @ (A) /zr! 
在 1 时 间 内 ,一 个 顾客 也 不 到 达 的 概率 为 
P(0)=e™ 
从 而 ,t 时 间 内 至 少 到 达 一 个 顾客 的 概率 为 
Pi SS 0) = 1—e* 
如 果 把 时 间 上 换 成 固定 的 时 间 间 隔 z, 则 有 ,在 任何 时 间 间 隔 = 内 至 少 有 一 个 到 达 发 生 
的 概率 仍 为 1 一 e*。 这 个 概率 和 上 一 次 顾客 到 达 的 时 刻 无关 。 新 顾客 在 下 一 个 + 时 间 内 
到 达 的 概率 和 以 前 顾客 的 到 达 无 关 , 这 个 特性 称 为 无 记忆 特性 或 马尔 可 夫 性 质 。 利 用 该 性 
质 , 可 以 简化 顾客 和 服务 的 排队 模型 。 
由 于 服务 器 的 服务 概率 也 服从 泊 松 分 布 , 也 可 推出 它 在 = 时 间 间 隔 内 至 少 为 一 个 顾客 
服务 的 概率 为 1 一 e 一 pt, 且 与 以 前 的 服务 过 程 无 关 , 因 此 ,服务 器 的 服务 特性 也 是 满足 马尔 
可 夫 性 质 的 。 


由 于 
P(x(t) 二 0)=1—e™Y 
其 密度 函数 为 
P(x(t) >0)=Ae™ 
t 的 期 望 值 等 于 


ECD| ae*dt =— te* |? +| er 三 症 烦 
0 0 


即 两 个 连续 到 达 的 顾客 之 间 的 平均 时 间 间 隔 为 /4。 同 理 ,可 得 服务 器 服务 时 间 的 平均 值 
为 1/n。 显 然 , 只 有 当 1/y 过 1/4, 也 就 是 4 二 py 时 ,系统 才 是 稳定 的 。 否 则 ,等 待 服务 队列 将 
无 限 增长 。 
设 S; 为 系统 的 一 个 状态 ,表示 等 待 服务 的 等 待 队 列 中 有 i 一 1 个 顾客 ,服务 器 中 有 1 个 
顾客 存在 。 由 概率 密度 函数 可 知 , 在 dt 时 间 内 1 个 新 顾客 到 达 的 概率 是 
P(dt 时 间 内 1 个 顾客 到 达 ) = Me dt 
将 上 式 做 多 项 式 展开 得 
Ae id 一 人 dt 十 OCdz) 
同 理 可 得 ,在 dt 时 间 内 服务 器 为 1 个 顾客 提供 服务 的 概率 是 
P(dt 时 间 内 1 个 顾客 离开 ) = pid 十 OCdz ) 

省 略 以 上 两 式 的 二 次 方 项 ,在 d 时 间 内 1 个 顾客 到 达 或 离开 的 概率 为 

P(dt 时 间 内 1 个 顾客 到 达 ) 一 Adt 

P (dt 时间 内 1 个 顾客 离开 ) = jdt 
对 于 i==0 时 ,有 

。0] 。 


P(dt 时 间 内 1 个 顾客 离开 ) == 0 
在 dt 时 间 内 ,顾客 一 个 也 不 到 达 和 顾客 一 个 也 不 离开 的 概率 为 
1 一 P(dt 时 间 内 1 个 顾客 到 达 ) 一 P(dt 时 间 内 1 个 顾客 离开 ) 
一 P(dz 时 间 内 2 个 以 上 顾客 到 达 ) 一 P(dt 时 间 内 2 个 以 上 顾客 离开 ) 
由 于 上 式 的 后 两 项 实际 上 是 d 的 二 次 方 以 上 的 函数 ,从 而 上 式 可 合并 为 
P(dt 时 间 内 不 发 生变 化 ) = 1 一 0 二 Ap) dd 一 0(d2) G 过 0) 
或 
P(dt 时 间 内 不 发 生变 化 ) = 1 一 dz 一 0(d2) (一 0) 

忽略 二 次 方 项 ,可 得 状态 变化 图 如 图 4.8 所 示 。 


1-1 dr 1-(A+LDdr 1-(A+LD)dz 1-(A+LDdr 1-(A+LD)dt 
4dt 4dl。 4dL。 (一 | 4dt Adit (a 
udt udt udt dt udit udt 


图 4.8 状态 转换 图 


设 系统 在 1 十 dt 时 间 内 处 于 状态 S; 的 概率 为 P(t 十 d?) , 则 由 状态 转换 图 有 
Pi(t+dt) = (1— Qt+p) di) P(t) + aAdt P(t) + pdt Pa t) 
式 中 i 宇 1。 对 于 i 二 0 时 ,有 
Pol(t+dt) = (1—Adi)P,() 十 pidt Plt) 
当 系 统 到 达 稳 定 状态 时 ,上 述 概 率 将 会 趋 于 一 个 常量 ,Pi(t 十 dt) 的 导数 为 0, 即 
Pi(t+ dt) =— (A+p)Pi(t) +AP +p P(t)=0 
Polt+ dt) =—APo(t)+pPi(t) =0 
即 
Pi: = QA/p) Po lt) 
(十 AD Pi(t) = Pat) +p Pn) 
令 A/1 王 p, 采 用 代入 法 可 得 
P;(1) = p'Po (1) 
另外 ,系统 运行 中 的 任 一 时 刻 总 是 处 于 图 4. 8 所 示 状 态 图 中 的 任 一 状态 中 ,从 而 有 


> 二 | 
由 此 可 得 
xp) =1 
由 于 在 p<1 时 有 和 
pe 
从 而 有 
P(t) =1—p 


即 ,在 稳 态 条 件 下 ,系统 内 不 存在 顾客 的 概率 为 1 一 p 二 (jy 一 A)/p, 而 系统 内 存在 顾客 的 概率 
为 4/x。 系 统 内 顾客 的 算术 平均 值 是 
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= l= pl 
把 上 述 按 FCFS 方式 排列 和 调度 ,并 只 有 一 个 服务 器 的 系统 称 为 M/M/1 系统 。 第 一 个 字 
母 M 表示 顾客 到 达 时 间 间 隔 是 指数 分 布 ,具有 马尔 可 夫 性 质 ;第 二 个 字母 M 表示 从 服务 器 
离开 的 顾客 的 时 间 间 隔 服 从 指数 分 布 ,具有 马尔 可 夫 性 质 ;数字 1 表示 只 有 一 个 服务 器 。 

设 响应 时 间 R 为 从 顾客 到 达 等 待 队 列 后 开始 到 离开 服务 器 的 时 间 , 则 在 系统 进入 稳定 
状态 之 后 ,系统 中 的 顾客 数 n 和 平均 响应 时 间 之 间 存 在 一 个 非常 简单 的 关系 , 即 n= 二 XR,X 
为 顾客 的 平均 到 达 率 。 该 公式 称 为 Little 结果 (Little's result) ,是 一 个 在 系统 分 析 中 广泛 
使 用 的 公式 。 

利用 Little 结果 ,可 以 求 出 M/M/1 系统 的 
平均 响应 时 间 : 
R=n/A= p/p) 一 1/GG 一 po)) 
平均 响应 时 间 和 p 的 关系 图 如 图 4. 9 所 示 。 

由 图 4.9 可 以 看 出 , M/M/1 系统 的 服务 性 Wh ' 四 
能 是 由 6 决定 的 。 如果 6 趋 近 1, 即 入 趋 过, 则 于 到 ? 
响应 时 间 急 剧 增 大 ,系统 性 能 变 差 ; 而 当 p 小 于 ”图 9 平均 响应 时 间 尺 和 。 的 关系 
1/2 时 ,等 待 队列 中 为 空 的 可 能 性 较 大 , 因为 平 
均 响 应 时 间 小 于 平均 服务 时 间 的 2 倍 。 

下 面 再 来 看 看 M/M/1 系统 对 短 作 业 或 短 进 程 的 影响 。 

设 短 作业 的 到 达 率 和 服务 率 分 别 为 (ui ,mm ) ,长 作业 的 到 达 率 和 服务 率 为 (lz ,p62), 且 二 
者 都 服从 泊 松 分 布 。 二 者 的 合成 仍 是 泊 松 过 程 (请 读者 自己 证 明 ) ,其 到 达 率 1 一 Ni 十 ha , 平 
均 服 务 时 间 为 


1 
| 2 作 


1/Aw = 一 Ai/ (CA 十 和 2) 1/p ta/ At A) * 1/p 
一 1/(CA 十 jz)* Ai/p + Az /pe ) 
从 而 有 
AM/ 三 Ai/ 十 az/ = po 

一 般 来 说 , 短 作业 的 服务 时 间 1/m 远 小 于 长 作业 的 服务 时 间 1/w 。FCFS 调度 策略 时 

有 响应 时 间 尺 为 
R= 1/Axp/(1—p) 

其 中 ,A 二 入 1 十 hz ,p 二 pi 十 p: 。 

由 于 4 和 po 中 包含 了 hi az wa 和 ys， 所 有 作业 的 平均 响应 时 间 相 同 ,从 而 , 短 作业 在 系 
统 中 的 驻 留 平均 时 间 与 长 作业 的 驻 留 平均 时 间 相 同 , 这 对 短 作 业 是 不 利 的 。 


4.5.2 轮转 法 调度 性 能 评价 


轮转 法 调度 时 的 顾客 到 达 率 要 大 大 高 于 FCFS 方式 。 设 时 间 片 为 g, 服 务 时 间 平 均值 
为 1//w, 每 个 顾客 平均 需要 & 个 时 间 片 。 从 而 有 1/w 一 &Ax* q。 如 果 某 个 顾客 刚好 需要 k 个 时 
间 片 的 服务 时 间 , 则 这 个 顾客 就 会 到 达 等 待 队列 & 次 (A>1)。 
对 于 短 作业 ,1/j 二 * q, 而 对 于 长 作业 ,1/pz 二 ko x*g。 设 新 顾客 的 到 达 率 4 二 和 1 十 hz， 
服务 时 间 为 
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1/p = GAi/p) ki* qt Gs/p) ks ¥q = (1/A) Ci/p tAs/p2) 
从 而 有 
AM 一 一 0 十 pe 
这 看 上 去 好 像 在 平均 响应 时 间 方 面 ,轮转 法 和 FCFS 调度 方式 差别 不 大 。 但 事实 上 ,在 等 待 
队列 中 享受 过 次 时 间 片 服务 的 顾客 的 响应 时 间 是 
R(k) =po/Q(1—p)=1/(y1— pop) = kxg/(1—p) 

也 就 是 说 ,响应 时 间 与 服务 时 间 成 正比 。 从 而 ,所 需 服 务 时 间 短 的 顾客 的 响应 时 间 将 会 小 于 
所 需 服务 时 间 长 的 顾客 的 响应 时 间 。 因 此 ,轮转 法 在 响应 时 间 上 要 优 于 FCFS 调度 方式 。 
4.5.3 线性 优先 级 法 的 调度 性 能 

线性 优先 级 调度 策略 (SRR) 是 介 于 FCFS 方式 和 轮转 法 之 间 的 一 种 调度 策略 。SRR 
方式 把 新 到 达 的 顾客 首先 送 入 等 待 室 休息 一 段 时 间 后 ,再 送 到 等 待 服务 队列 ( 见 图 4. 10)。 
设 顾 客 到 达 等 待 室 的 到 达 率 为 ,到达 等 待 队 列 的 到 达 率 为 X*。X 依赖 于 等 待 室 的 到 达 率 X 
和 线性 参数 7 ,其 中 7 二 1 一 b/a。 由 4.4 节 可 知 , 有 45, 且 a 和 4 分 别 为 等 待 室内 顾客 和 等 
待 队 列 中 顾客 优先 级 的 线性 增加 系数 。 


到 达 率 
4 [三 | 二 | | | 请 =| 服务 器 完成 


| 达 率 
到 这 率 久 各 各 区 列 
图 4.10 ”线性 优先 级 调度 的 评价 模型 


设 4 和 zs 分别 为 两 个 顾客 接连 到 达 等 待 室 的 时 间 , 则 有 


1/A=ts—u 
设 4 和 如 分 别 为 两 个 顾客 从 等 待 室 接连 到 达 等 待 队列 的 时 间 , 则 有 
1/X = tt 
由 图 4.6 可 知 , 有 
(加 一 看 )7( 芍 一 在 大 三 
即 


Pp ES 交 三 : 关 
由 于 7 过 1, 所 以 等 待 室 以 7 的 比率 滞留 到 达 的 顾客 。 
线性 优先 级 调度 系统 的 响应 时 间 是 Rs.。 且 R,; 为 等 待 室 的 平均 等 待 时 间 Rs 和 进入 等 
待 队 列 后 得 到 服务 的 平均 响应 时 间 R, 之 和 。 由 对 轮转 法 的 分 析 , 则 有 : 
R. = 1/(y—N) 
r#R, = /Ce—A) 
从 而 


Ro=r*R.—R=1/—A)—1/ ND = NW) [一 DC 人 一 2 ) 
另外 ,由 轮转 法 可 知 : 
R.(k) = kgq/(1—p) 
其 中 ,p= 二 4/x。 从 而 有 
Rs (k) =Ra+ RR) = A D/Cp— VX) +hR/(1—p) 


。04。 


=1/Ge—X} = kp/ty=W 
其 中 是 一 个 顾客 享受 服务 的 时 间 片 的 次 数 ,g 是 时 间 片 常数 。 
可 以 比较 一 下 FCFS 方式 .SRR 方式 以 及 轮转 法 3 种 调度 方式 的 平均 响应 时 间 。 
采用 FCFS 方式 时 ,有 : 
Ri(k) = 1/ 一 人 ) 
采用 轮转 法 时 有 
RCR) = kqu/ (pC— 1) 
采用 SRR 方式 时 , 则 响应 时 间 为 
民风 三 Wa=A) = (kg) /y= 
如 果 kg 二 1/p, 即 顾客 的 服务 时 间 与 其 平均 服务 时 间 相 等 的 话 , 则 Rs(k) 中 第 二 项 变 为 
0, 上 述 Ri.(k) 二 Ra(k) 二 Rs(k)。 当 然 ,对 于 需要 服务 时 间 短 的 顾客 来 说 ,有 kg 过 1/y, 而 对 
于 需要 服务 时 间 长 的 顾客 来 说 , 则 有 Ag 之 1/w。 从 而 ,对 于 服务 时 间 短 的 顾客 ,其 响应 时 
间 为 


Rs < Rs Re 
而 对 于 服务 时 间 长 的 顾客 来 说 ,其 响应 时 间 则 为 
Ri < RR 
只 是 从 响应 时 间 的 角度 对 几 种 常见 的 调度 策略 进行 了 评价 分 析 。 除 了 响应 时 间 之 
Pe ere eer eng 个 标准 。 


4.6 实时 系统 调度 方法 


4.6.1 实时 系统 的 特点 


随 着 移动 通信 和 网 络 计 算 技术 的 发 展 , 实 时 系统 正 变 得 越 来 越 重 要 。 操 作 系 统 是 实时 
系统 中 最 重要 的 部 分 之 一 , 它 负责 在 用 户 要 求 的 时 限 内 进行 事件 处 理 和 控制 。 

实时 系统 与 其 他 系统 最 大 的 区 别 在 于 ,其 处 理 和 控制 的 正确 性 不 仅仅 取决 于 计算 的 逻 
辑 结 果 , 而 且 取 决 于 计算 和 处 理 结果 产生 的 时 间 。 因 此 ,实时 系统 的 调度 与 工业 生产 中 的 生 
产 过 程 调度 有 许多 相同 之 处 , 即 把 给 定 的 任务 按 所 要 求 的 时 限 调配 到 相应 的 设备 上 去 处 理 
完成 。 

根据 对 处 理 外 部 事件 的 时 限 (deadline) 要 求 ,实时 系统 中 处 理 的 外 部 事件 可 分 为 硬 实 时 
任务 (hard real time task) 和 软 实时 任务 (soft real time task) 。 硬 实时 任务 要 求 系统 必须 完 
全 满足 任务 的 时 限 要求 ; 软 实时 任务 则 允许 系统 对 任务 的 时 限 要 求 有 一 定 的 延迟 ,其 时 限 要 
求 只 是 一 个 相对 条 件 。 

实时 系统 的 另 一 个 特点 是 它 所 处 理 的 外 部 任务 可 分 为 周期 性 的 与 非 周 期 性 的 两 大 类 。 
对 于 非 周期 性 任务 来 说 ,必定 存在 一 个 完成 或 开始 进行 处 理 的 时 限 ,而 周期 性 任务 只 要 求 在 
周期 工 内 完成 或 开始 进行 处 理 。 

一 般 来 说 ,实时 操作 系统 具有 以 下 特点 : 

(1) 有 限 等 待 时 间 ( 决 定性 特性 )。 

(2) 有 限 响应 时 间 。 


(3) 用 户 控制 。 

(4) 可 靠 性 高 。 

(5) 系统 出 错 处 理 能 力 强 。 

分 时 系统 中 并 发 执行 的 进程 具有 不 确定 性 ,其 执行 顺序 与 执行 环境 有 关 。 实 时 系统 则 
不 然 , 它 要 求 所 有 的 进程 在 处 理事 件 时 都 必须 在 有 限时 间 内 开始 ,这 一 特性 又 被 称 为 实时 系 
统 的 决定 性 特性 。 

实时 系统 的 有 限 响 应 时 间 特 性 是 指 从 系统 响应 外 部 事件 开始 ,必须 在 有 限时 间 内 处 理 
比 
另外 ,在 分 时 的 非 实时 系统 中 ,用 户 不 能 参与 对 进程 调度 的 控制 。 在 实时 系统 中 ,用 户 
可 以 控制 进程 的 优先 级 并 选择 相应 的 调度 算法 ,从 而 达到 对 进程 执行 先后 顺序 的 控制 。 
实时 系统 要 求 很 高 的 可 靠 性 。 在 分 时 系统 的 非 实 时 系统 中 ,用 户 可 以 用 重新 启动 计算 
机 等 措施 来 处 理 系 统 出 错 。 但 是 ,实时 系统 主要 是 对 外 部 事件 进行 处 理 和 控制 ,例如 导弹 系 
统 的 控制 ,这 样 的 系统 不 允许 出 现 控制 错误 。 

另外 , 当 系 统 发 生 错 误 时 ,实时 系统 不 能 像 非 实时 系统 那样 , 先 停止 当前 处 理 的 用 户 程 
序 , 转 去 执行 出 错 处 理 或 使 系统 自动 退出 。 实 时 系统 要 求 系统 在 出 错时 , 既 能 够 处 理 所 发 生 
的 错误 ,又 不 影响 当前 正在 执行 的 用 户 应 用 。 

实时 系统 的 上 述 特性 要 求实 时 操作 系统 具有 下 述 能 力 : 

(1) 很 快 的 进程 或 线程 切换 速度 。 

进程 或 线程 切换 速度 是 实时 系统 设计 的 核心 。 与 分 时 系统 不 同 , 公 平 性 以 及 最 小 平均 
响应 时 间 等 指标 在 实时 系统 中 并 不 重要 ,实时 系统 中 调度 算法 的 设计 原则 是 满足 所 有 硬 实 
时 任务 的 处 理 时 限 和 尽 可 能 多 地 满足 软 实 时 任务 的 处 理 时 限 。 

(2) 快速 的 外 部 中 断 响应 能 力 。 

有 关中 断 处 理 和 响应 的 详细 介绍 在 第 9 章 中 给 出 ,不 过 ,只 有 对 外 部 中 断 信 号 反应 迅 
速 ,系统 才能 对 外 部 事件 作出 迅速 反应 。 

(3) 基于 优先 级 的 随时 抢先 式 调度 策略 。 

基于 优先 级 的 调度 策略 大 致 有 以 下 4 种 : 

@ 优先 级 十 时 间 片 轮转 调度 策略 ; 

@ 基于 优先 级 的 非 抢 先 式 调度 策略 ; 

@ 基于 优先 级 的 固定 点 抢先 式 调度 策略 ; 

@ 基于 优先 级 的 随时 抢先 式 调度 策略 。 

对 于 调度 策略 @ 来 说 ,因为 调度 必须 在 时 间 片 到 来 时 才能 发 生 , 实 时 进程 必须 等 待 占有 
处 理 机 的 进程 执行 到 时 间 片 结束 时 才能 获得 处 理 机 ,因此 ,这 种 方法 不 能 用 作 实 时 调度 。 同 
理 , 基 于 优先 级 的 非 抢先 式 调度 策略 也 不 能 用 作 实 时 调度 ,因为 高 优先 级 的 实时 进程 只 有 在 
当前 执行 进程 自动 让 出 处 理 机 之 后 才能 获得 处 理 机 。 

基于 优先 级 的 固定 点 抢先 式 调 度 方式 与 基于 优先 级 的 随时 抢先 式 调 度 策略 是 实时 系统 
的 主要 调度 策略 。 基 于 优先 级 的 固定 点 抢先 式 调 度 方式 与 优先 级 十 时 间 片 轮转 调度 方式 有 
相似 之 处 ,其 主要 区 别 在 于 允许 抢先 的 固定 点 间隔 要 比 时 间 片 小 得 多 ,并 保证 能 满足 所 有 硬 
实时 的 处 理 时 限 。 
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4.6.2 实时 调度 算法 的 分 类 


实时 调度 算法 分 为 如 下 4 类 : 

1. 静态 表格 驱动 类 

静态 表格 驱动 类 的 实时 调度 算法 ,对 可 能 的 调度 条 件 和 参数 进行 静态 分 析 , 并 将 分 析 结 
果 作 为 实际 调度 结果 。 这 类 调度 算法 多 用 于 调度 处 理 周 期 性 任务 ,其 主要 分 析 参 数 为 周期 ， 
执行 时 间 、 周 期 执行 结束 时 限 和 任务 优先 级 等 。 最 早 时 限 优先 法 是 比较 典型 的 静态 表格 驱 
动 算法 。 这 里 ,最 早 时 限 优先 法 是 优先 调度 时 限 最 早 的 任务 获得 处 理 机 的 调度 算法 。 

2. 静态 优先 级 驱动 抢先 式 调 度 算 法 类 

该 类 算法 也 进行 静态 分 析 , 不 过 ,它们 的 静态 分 析 不 直接 产生 调度 结果 ,而 只 用 来 指定 
任务 的 优先 级 。 频 率 单调 调度 算法 就 是 一 种 静态 优先 级 驱动 的 抢先 式 调度 算法 。 

3. 动态 计划 调度 算法 类 

动态 计划 调度 算法 在 调度 任务 执行 之 前 排出 调度 计划 ,并 分 析 计 划 的 调度 结果 是 否 使 
得 任务 所 要 求 的 处 理 时 限 得 到 满足 。 如 果 能 够 满足 , 则 按 调度 计划 执行 ,否则 修改 调度 
计划 。 

4. en 

一 类 算法 不 进行 可 能 性 分 析 ,上 5 ee 首 定 相应 的 优先 级 ,并 进行 

调度。 Oe 实现 容易 。 但 是 ,该 算法 不 一 定 满足 用 户 要 求 的 处 理 
时 限 。 


4.6.3 ”时限 调度 算法 与 频率 单调 调度 算法 


时 限 调度 算法 是 一 种 以 满足 用 户 要 求 的 时 限 为 调度 原则 的 算法 。 在 实时 系统 中 的 用 户 
要 求 时 限 有 两 种 , 即 处 理 开始 时 限 (starting deadline) 和 处 理 结束 时 限 (ending deadline) 。 
时 限 调度 算法 可 以 使 用 任 一 种 时 限 。 时 限 调度 算法 可 用 于 周期 性 调度 与 非 周 期 性 调度 
两 种 。 

时 限 调度 算法 所 需要 的 相关 输入 信息 包括 以 下 几 种 : 

1. 任务 就 绪 时 间或 事件 到 达 时 间 

任务 就 绪 时 间或 事件 到 达 时 间 指 的 是 进程 进入 就 绪 状态 ,可 以 被 调度 执行 的 时 间 。 对 
于 周期 性 任务 来 说 ,该 时 间 是 可 以 预知 的 ,而 且 时 间 间 隔 是 周期 性 的 。 对 于 非 周 期 性 任务 来 
说 ,这 些 时 间 可 能 是 可 预知 的 ,但 大 部 分 时 候 是 不 可 预知 的 ,需要 事件 发 生来 驱动 。 

2. 开始 时 限 

开始 时 限 指 处 理 机 必须 开始 对 任务 进行 处 理 的 时 限 。 

3. 完成 时 限 

完成 时 限 指 任务 必须 完成 的 时 间 。 

4. 处 理 时 间 

处 理 时 间 指 完成 相关 任务 所 需 占 用 处 理 机 的 时 间 。 

资源 需求 指 除 了 处 理 机 之 外 ,另外 还 需要 的 其 他 硬 软 件 资源 。 如 果 所 处 理 的 任务 有 处 
理 机 之 外 的 其 他 资源 需求 , 则 调度 算法 要 复杂 得 多 。 
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6. 优先 级 

优先 级 可 由 分 析 计算 后 获得 ,也 可 根据 时 限 要 求 由 用 户 指定 。 

时 限 调度 算法 的 基本 思想 是 : 按 用 户 的 时 限 要 求 顺 序 设置 优先 级 ,优先 级 高 者 占据 处 
理 机 ,也 就 是 说 ,时 限 要 求 最 近 的 任务 优先 占有 处 理 机 。 

时 限 调度 是 抢先 式 的 。 抢 先 式 时 限 调度 算法 必须 把 新 到 达 任 务 的 时 限 要 求 和 当前 正在 
执行 任务 的 时 限 要 求 进行 比较 ,如 果 新 到 达 任 务 的 时 限 要 求 更 近 , 则 应 执行 新 到 达 的 任务 。 

下 面 是 一 个 使 用 时 限 调度 算法 调度 周期 性 实时 任务 的 例子 。 

设 实时 系统 从 两 个 不 同 的 数据 源 DA 和 DB 周期 性 地 收集 数据 并 进行 处 理 , 其 中 DA 
的 时 限 要 求 以 30ms 为 周期 ,DB 的 时 限 要 求 以 75ms 为 周期 。 设 DA 所 需 处 理 时 限 为 
15ms,DB 所 需 处 理 时 限 为 38ms, 则 与 DA 和 DB 有 关 进 程 的 事件 发 生 时 限 ( 就 绪 时 限 ), 执 
行 时 限 以 及 结束 时 限 如 表 4. 1 所 示 。 


表 4.1 周期 性 任务 的 预计 发 生 、 执 行 与 结束 时 限 


进程 事件 发 生 时 限 /ms 执行 时 限 /ms 结束 时 限 /ms 
DA(1) 0 15 30 
DA(2) 30 15 60 
DA(3) 60 本 90 
DB(1) 0 38 75 
DB(2) 75 38 150 
DB(3) 150 38 226 


如 果 使 用 时 限 调度 算法 ,并 按 最 近 结 束 时 限 优先 级 最 高 的 方法 进行 排列 ,可 以 给 出 
表 4. 1 所 示 各 进程 的 调度 顺序 和 相对 时 间 ( 见 图 4. 11) 。 
| DA() ， DB(1) DA(2) ， DB(1) DB(1) DA(G3) ， DA(4) DB(2) 
0 15 30 45 60 3 90 105 130 1 
图 4.11 时 限 调度 算法 给 出 的 调度 顺序 


如 图 4.11 所 示 ,在 开始 时 ,进程 DA(1) 和 DB(1) 的 结束 时 限 比较 ,DA(1) 的 结束 时 限 
最 近 , 从 而 调度 进程 DA(1) 执 行 。DA(1) 的 实际 结束 时 间 为 15ms, 小 于 30ms 的 时 限 要 求 。 
紧 接着 ,进程 DB(1) 被 调度 执行 。 在 执行 到 时 间 为 30ms 时 ,进程 DA(2) 进 入 就 绪 状 态 。 由 
于 DA(2) 的 结束 时 限 为 60ms, 近 于 DB(1) 的 结束 时 限 75ms, 从 而 DB(1) 被 DA(2) 抢 先 。 
DA(2) 的 实际 结束 时 间 为 45ms, 小 于 要 求 时 限 60ms。 

在 DA(2) 结 束 之 后 ,DB(1) 再 次 占有 处 理 机 继续 执行 , 当 DB(1) 执 行 到 时 间 为 60ms 
时 ,进程 DA(3) 进 入 就 绪 状 态 。 但 是 ,由 于 DA(3) 的 结束 时 限 为 90ms, 远 于 DB(1) 的 结束 
时 限 75ms, 从 而 DB(1) 继 续 执 行 。 

时 限 调度 算法 也 可 以 用 于 非 周 期 性 任务 调度 。 

频率 单调 调度 算法 是 一 种 被 广泛 用 于 多 周期 性 实时 处 理 的 调度 算法 。 其 基本 原理 是 频 
率 越 低 (周期 越 长 ) 的 任务 的 优先 级 越 低 。 

另外 , 设 周 期 性 任务 的 执行 时 间 为 C, 则 使 用 频率 单调 调度 算法 的 必要 条 件 是 C<T。 

。98 。 


已 经 证 明 , 对 于 n(n 三 1) 个 周期 的 不 同 任务 来 说 , 设 每 个 周期 为 T;, 其 相应 任务 的 执行 
时 间 为 C;, 则 使 用 频率 单调 调度 算法 的 充分 条 件 是 


CO C2 | CG | GC ea 
和 ps T T 元 十 T T S72 i 
例如 ,对 于 由 3 个 周期 组 成 的 实时 任务 序列 来 说 ,其 执行 时 间 与 周期 之 比 应 是 
G3 1)= 0.799 


EA i 一 
如 果 进 程 执 行 时 间 与 周期 比 之 和 大 于 nC(2” 一 1), 则 用 户 所 要 求 的 时 限 无 法 保证 。 


本 章 小 结 


CPU 是 计算 机 系统 中 十 分 重要 的 资源 ,本 章 主要 介绍 处 理 机 的 调度 目标 、 策 略 以 及 评 
价 方法 等 。 

因为 处 理 机 调度 程序 不 可 能 选择 全 部 驻 留 在 外 存 的 进程 ,因此 ,在 调度 一 个 进程 占有 处 
理 机 之 前 ,系统 必须 按 某 种 策略 把 外 存 中 处 于 后 备 状态 的 作业 选择 出 来 ,并 创建 进程 和 分 配 
内 存 ,为 进程 执行 准备 必需 的 资源 。 这 一 步 称 为 作业 调度 或 高 级 调度 。 作 业 调 度 的 目标 是 
尽量 做 到 公平 合理 ,能 执行 尽 可 能 多 的 作业 、 尽 可 能 快 的 响应 时 间 以 及 高 的 设备 利用 率 等 。 
任 一 调度 算法 要 同时 满足 这 些 调 度 目 标 是 不 可 能 的 。 大 多 数 操作 系统 都 是 根据 用 户 需要 而 
采用 兼顾 某 些 目标 的 方法 。 比 较 常用 的 作业 调度 算法 有 FCFS 方法 、SJF( 最 短 作业 优先 ) 法 
和 HRN( 最 高 响应 比 ) 法 等 。 这 几 种 方法 各 有 特点 。 其 中 FCFS 法 系统 开销 小 , 且 对 每 个 作 
业 来 说 按 其 到 达 顺 序 被 依次 调度 。FCFS 法 不 利于 短 作 业 。SJF 法 可 得 到 最 大 系统 吞吐 
率 , 即 每 天 处 理 的 作业 个 数 最 多 。 但 是 SJIF 法 有 可 能 使 长 作业 永远 没有 机 会 执行 。HRN 
法 是 介 于 FCFS 法 和 SJF 法 之 间 的 一 种 方法 。 

除了 作业 调度 之 外 ,还 介绍 了 一 种 称 为 交换 调度 的 中 级 调度 。 在 有 的 系统 中 ,把 那些 处 
于 等 待 状态 或 就 绪 状 态 的 进程 换 出 内 存 , 而 把 那些 等 待 事件 已 经 发 生 或 已 在 外 存 交换 区 中 
等 待 了 较 长 时 间 的 进程 换 入 内 存 。 

只 有 在 进程 被 建立 起 来 并 且 已 获得 足够 的 资源 之 后 ,系统 才 使 用 进程 调度 策略 把 处 理 
机 分 配给 选 出 进程 。 因 此 ,处 理 机 的 调度 涉及 3 个 层次 的 调度 。 进 程 调度 的 主要 任务 是 选 
择 一 个 合适 的 进程 占据 处 理 机 。 系 统 的 要 求 不 一 样 , 进 程 调度 方法 变化 较 大 。 比 较 常 用 的 
有 RR( 轮 转 ) 法 .FCFS( 先 来 先 服务 ) 法 、 优 先 级 法 和 SRR( 线 性 优先 级 ) 法 等 。 其 中 轮转 法 
主要 用 于 分 时 系统 , 它 具 有 和 较 好 的 响应 时 间 , 且 对 每 个 进程 来 说 都 具有 较 好 的 公平 性 。 
FCFS 法 不 利于 执行 时 间 短 的 进程 ,而 SRR 法 则 是 介 于 FCFS 法 和 RR 法 之 间 的 一 种 进程 
调度 方法 。 


习题 


4.1 什么 是 分 级 调度 ? 分 时 系统 中 有 作业 调度 的 概念 吗 ? 如 果 没 有 ,为 什么 ? 

4.2 试 述 作业 调度 的 主要 功能 。 

4.3 作业 调度 的 性 能 评价 标准 有 哪些 ? 这 些 性 能 评价 标准 在 任何 情况 下 都 能 反映 调度 策 
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4.4 
4.5 
4.6 


4.8 


4.9 


略 的 优 劣 吗 ? 


进程 调度 的 功能 有 哪些 ? 
进程 调度 的 时 机 有 哪 几 种 ? 
假设 有 4 道 作 业 , 它 们 的 提交 时 刻 及 执行 时 间 由 下 表 给 出 : 
作业 号 提交 时 刻 /hh:mm 执行 时 间 /hr 
1 10 :00 2 
2 1 
3 0.5 
4 0.3 


计算 在 单 道 程序 环境 下 ,采用 先 来 先 服务 调度 算法 和 最 短 作 业 优先 调度 算法 时 的 平均 
周转 时 间 和 平均 带 权 周转 时 间 ,并 指出 它们 的 调度 顺序 。 
设 某 进程 所 需要 的 服务 时 间 :一 A* g, 其 中 ,为 时 间 片 的 个 数 ,9 为 时 间 片 长 度 且 为 党 
数 。 当 :为 一 定 值 时 , 令 g 趋 于 0, 则 有 kk 趋 于 无 穷 ,从 而 服务 时 间 为 1 的 进程 响应 时 
间 了 为 上 的 连续 函数 。 对 应 于 时 间 片 的 轮转 调度 方式 (RR)、 先 来 先 服务 方 式 (FCFS) 
和 线性 优先 级 调度 方式 (SRR) ,其 响应 时 间 函 数 分 别 为 

T(t) = txp/ (pC—A) 

Tet = (p=V 

Tu) = /ND— (1—t wp —X) 
其 中 ,X==((1 一 6b)/a) * 4A=rxA。 
取 Q,p) 二 (50,100) 和 (GA,y) 二 (80,100), 分 别 改变 r 的 值 , 画 出 T, (1)、Tr (1) 和 
T,(?) 的 时 间 变 化 图 。 
什么 是 多 处 理 机 系统 ?并 行 处 理 系 统 、 计 算 机 网 络 、 分 布 式 系 统 和 多 处 理 机 系统 的 操 
作 系 统 之 间 有 何 区 别 ? 
什么 是 实时 调度 ? 它 与 非 实时 调度 有 何 区 别 ? 


4.10 写 出 表 4.1 所 示 周 期 性 任务 调度 用 的 时 限 调度 算法 。 
4.11 设 周期 性 任务 P,P; ,Ps 的 周期 TT,T; ,Ts 分 别 为 100,150,350, 执 行 时 间 分 别 为 


20,40,100, 问 : 是 否 可 用 频率 单调 调度 算法 进行 调度 ? 
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第 5 章 存储 管理 


5.1 存储 管理 的 功能 


存储 器 是 计算 机 系统 的 重要 资源 之 一 。 因 为 任何 程序 和 数据 以 及 各 种 控制 用 的 数据 结 
构 都 必须 占用 一 定 的 存储 空间 ,因此 ,存储 管理 直接 影响 系统 性 能 。 

存储 器 由 内 存 (primary storage) 和 外 存 (secondary storage) 组 成 。 内 存 由 顺序 编 址 的 
块 组 成 ,每 块 包 含 相应 的 物理 单元 。CPU 要 通过 启动 相应 的 输入 输出 设备 后 才能 使 外 存 与 
内 存 交 换 信息 。 本 章 主要 讨论 内 存 管理 问题 ,内 容 包 括 几 种 常用 的 内 存 管理 方法 .内存 的 分 
配 和 释放 算法 .虚拟 存储 器 的 概念 .控制 主 存 和 外 存 之 间 的 数据 流动 方法 .地 址 变换 技术 和 
内 存 数 据 保护 与 共享 技术 等 。 下 面 先 介绍 存储 管理 的 功能 。 


5.1.1 虚拟 存储 器 


虚拟 存储 器 是 存储 管理 的 核心 概念 。 现 代 计算 机 系统 的 物理 存储 器 都 分 为 内 存 和 外 
存 , 其 理由 是 内 存 价格 昂贵 ,不 可 能 用 大 容量 的 内 存 存储 所 有 被 访问 的 或 不 被 访问 的 程序 与 
数据 段 。 而 外 存 尽 管 访问 速度 较 慢 ,但 价格 便宜 ,适合 存放 大 量 信息 。 实 验证 明 , 在 一 个 进 
程 的 执行 过 程 中 ,其 大 部 分 程序 和 数据 并 不 经 常 被 访问 。 这 样 ,存储 管理 系统 把 进程 中 那些 
不 经 常 被 访问 的 程序 段 和 数据 放 人 外 存 中 , 待 需要 访问 它们 时 再 将 它们 调和 人 内存 。 那 么 ,对 
于 那些 一 部 分 数据 和 程序 段 在 内 存 而 另 一 部 分 在 外 存 的 进程 ,怎样 安排 它们 的 地 址 呢 ? 

通常 由 用 户 编写 的 源 程 序 , 首 先 要 由 编译 程序 编译 成 CPU 可 执行 的 目标 代码 。 然 后 ， 
链接 程序 把 一 个 进程 的 不 同 程序 段 链接 起 来 以 完成 所 要 求 的 功能 。 显 然 , 对 于 不 同 的 程序 
段 , 应 具有 不 同 的 地 址 。 有 两 种 方法 安排 这 些 编译 后 的 目标 代码 的 地 址 。 一 种 方法 是 按照 
物理 存储 器 中 的 位 置 赋予 实际 物理 地 址 。 这 种 方法 的 好 处 是 CPU 执行 目标 代码 时 的 执行 
速度 高 。 但 是 ,由 于 物理 存储 器 的 容量 限制 ,能 装 和 内存 并 发 执行 的 进程 数 将 会 大 大 减少 ， 
对 于 某 些 较 大 的 进程 来 说 , 当 其 所 要 求 的 总 内 存 容量 超过 内 存 容 量 时 将 会 无 法 执行 。 另 外 ， 
由 于 编译 程序 必须 知道 内 存 的 当前 空闲 部 分 及 其 地 址 ,并 且 把 一 个 进程 的 不 同 程序 段 连续 
地 存放 起 来 ,因此 编译 程序 将 非常 复杂 。 

另 一 种 方法 是 编译 链接 程序 把 用 户 源 程序 编译 后 链接 到 一 个 以 0 地 址 为 始 地 址 的 线性 
或 多 维 虚拟 地 址 空间 。 这 里 ,链接 既 可 以 是 在 程序 执行 以 前 由 链接 程序 完成 的 静态 链接 ,也 
可 以 是 在 程序 执行 过 程 中 由 于 需要 而 进行 的 动态 链接 。 而 且 , 每 一 个 进程 都 拥有 这 样 一 个 
空间 (这 个 空间 是 一 维 的 还 是 多 维 的 由 存储 管理 方式 决定 ) 。 每 个 指令 或 数据 单元 都 在 这 个 
虚拟 空间 中 拥有 确定 的 地 址 ,这 个 地 址 称 为 虚拟 地 址 (virtual address) 。 显 然 , 进 程 在 该 空 
间 的 地 址 排列 可 以 是 非 连续 的 ,其 实际 物理 地 址 由 虚拟 地 址 到 实际 物理 地 址 的 变换 得 到 。 
由 源 程序 到 实际 存放 该 程序 指令 或 数据 的 内 存 物理 位 置 的 变换 如 图 5. 1 所 示 。 

进程 中 的 目标 代码 ,数据 等 的 虚拟 地 址 组 成 的 虚拟 空间 称 为 虚拟 存储 器 (virtual store 
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图 5.1 地 址 变换 与 物理 存储 器 


或 virtual memory)。 虚 拟 存储 器 不 考虑 物理 存储 器 的 大 小 和 信息 存放 的 实际 位 置 ,只 规定 
每 个 进程 中 互相 关连 的 信息 的 相对 位 置 。 与 实际 物理 存储 器 数量 有 限 , 且 被 所 有 进程 共享 
不 一 样 ,每 个 进程 都 拥有 自己 的 虚拟 存储 器 , 且 虚 拟 存 储 器 的 容量 是 由 计算 机 的 地 址 结构 和 
寻 址 方式 确定 的 。 例 如 ,直接 寻 址 时 ,如 果 CPU 的 有 效 地 址 长 度 为 16 位 , 则 其 寻 址 范围 为 
0~64K。 

图 5. 1 中 的 编译 和 链接 主要 是 语言 系统 的 设计 问题 ,而 虚拟 存储 器 到 物理 存储 器 的 变 
换 是 操作 系统 必须 解决 的 问题 。 要 实现 这 个 变换 ,必须 要 有 相应 的 硬件 支持 ,并 使 这 些 硬 件 
能 够 完成 统一 管理 内 存 和 外 存 之 间 数 据 和 程序 段 自动 交换 的 虚拟 存储 器 功能 。 即 ,由 于 每 
个 进程 都 拥有 自己 的 虚 存 , 且 每 个 虚 存 的 大 小 不 受 实际 物理 存储 器 的 限制 ,因此 ,系统 不 可 
能 提供 足够 大 的 内 存 来 存放 所 有 进程 的 内 容 。 内 存 中 只 能 存放 那些 经 常 被 访问 的 程序 和 数 
据 段 等 。 这 就 需要 有 相当 大 的 外 部 存储 器 ,以 存储 那些 不 经 常 被 访问 或 在 某 一 段 时 间 内 不 
会 被 访问 的 信息 。 待 到 进程 执行 过 程 中 需要 这 些 信息 时 ,再 从 外 存 中 自动 调 入 内 存 。 至 于 
如 何 具体 实现 和 管理 虚拟 存储 器 ,将 在 后 面 有 关 章 节 介 绍 。 


5.1.2 地 址 变换 


内 存 地 址 的 集合 称 为 内 存 空 间或 物理 地 址 空间 。 内 存 中 ,每 一 个 存储 单元 都 与 相应 的 
称 为 内 存 地 址 的 编号 相对 应 。 显 然 ,内存 空 间 是 一 维 线性 空间 。 

怎样 把 几 个 虚 存 的 一 维 线性 空间 或 多 维 线性 空间 变换 到 内 存 的 唯一 的 一 维 物理 线性 空 
间 呢 ?这 涉及 两 个 问题 。 

第 一 个 问题 是 虚拟 空间 的 划分 问题 。 例 如 进程 的 正文 段 和 数据 段 应 该 放置 在 虚拟 空间 
的 什么 地 方 。 虚 拟 空间 的 划分 使 得 编译 链接 程序 可 以 把 不 同 的 程序 模块 (它们 可 能 是 用 不 
同 的 高 级 语言 编写 的 ) 链 接 到 一 个 统一 的 虚拟 空间 中 。 虚 拟 空间 的 划分 与 计算 机 系统 结构 
有 关 , 例 如 ;VAX-11 型 机 中 的 虚拟 空间 划分 为 进程 空间 和 系统 空间 两 大 部 分 ,而 进程 空间 
又 更 进一步 划分 为 程序 区 和 控制 区 。VAX-11 的 虚拟 空间 容量 为 2* 个 单元 ,其 中 程序 区 占 
2 个 单元 ,用 来 存放 用 户 程序 ,程序 段 以 零 为 基 址 动态 地 向 高 地 . 
直方 向 增长 ,最 大 可 达 2 一 1 号 单元 。 控 制 区 也 占 29 个 间 元 , 存 gga 2 [| | 
放 各 种 方式 和 状态 下 的 堆栈 结构 及 数据 等 ,其 虚拟 地 址 由 23 一 1 2 
号 地 址 开始 由 高 向 低地 址 方向 增长 。 系 统 空间 占 23 个 单元 ,用 来 ”系统 空间 ，， 
存放 操作 系统 程序 。VAX-11 机 的 虚拟 空间 结构 如 图 5. 2 所 示 。 图 5.2 虚拟 空间 的 划分 

第 二 个 问题 是 把 虚拟 空间 中 已 链接 和 划分 好 的 内 容 装 入 内 
存 ,并 将 虚拟 地 址 映射 为 内 存 地 址 的 问题 , 称 之 为 地 址 重 定位 或 地 址 映射 。 地 址 映射 就 是 要 
建立 虚拟 地 址 与 内 存 地 址 的 关系 。 实 现 地 址 重 定位 或 地 址 映射 的 方法 有 两 种 : 静态 地 址 重 
定位 和 动态 地 址 重 定位 。 

1. 静态 地 址 重 定位 

静态 地 址 重 定位 (static address relocation) 是 在 虚拟 空间 程序 执行 之 前 由 装配 程序 完 
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成 地 址 映射 工作 。 假 定 分 配 程序 已 分 配 了 一 块 首 地 址 为 BA 的 内 存 区 给 虚拟 空间 内 的 程序 
段 , 且 每 条 指令 或 数据 的 虚拟 地 址 为 VA, 那 么 ,该 指令 或 数据 对 应 的 内 存 地 址 为 MA, 从 而 
完成 程序 中 所 有 地 址 部 分 的 修改 ,以 保证 CPU 的 正确 执行 。 显 然 , 对 于 虚拟 空间 内 的 指令 
或 数据 来 说 ,静态 地 址 重 定位 只 完成 一 个 首 地 址 不 同 的 连续 地 址 变换 。 它 要 求 所 有 待 执行 
的 程序 必须 在 执行 之 前 完成 它们 之 间 的 链接 ,否则 将 无 法 得 到 正确 的 内 存 地 址 和 内 存 空间 。 

静态 重 定位 的 优点 是 不 需要 硬件 支持 。 但 是 ,使 用 静态 重 定位 方法 进行 地 址 变换 无 法 
实现 虚拟 存储 器 。 这 是 因为 ,虚拟 存储 器 呈现 在 用 户 面前 的 是 一 个 在 物理 上 只 受 内 存 和 外 
存 总 容量 限制 的 存储 系统 ,这 要 求 存储 管理 系统 只 把 进程 执行 时 频繁 使 用 和 立即 需要 的 指 
令 与 数据 等 存放 在 内 存 中 ,而 把 那些 暂时 不 需要 的 部 分 存放 在 外 存 中 , 待 需要 时 自动 调 人 ， 
以 提高 内 存 的 利用 率 和 并 发 执行 的 作业 道 数 。 显 然 ,这 是 与 静态 重 定位 方法 矛盾 的 ,静态 重 
定位 方法 将 程序 一 旦 装 入 内 存 之 后 就 不 能 再 移动 ,并 且 必 须 在 程序 执行 之 前 将 有 关 部 分 全 
部 装 入 。 

静态 重 定 位 的 另 一 个 缺点 是 必须 占用 连续 的 内 存 空 间 , 这 就 难以 做 到 程序 和 数据 的 
共享 。 

2. 动态 地 址 重 定位 

动态 地 址 重 定位 (dynamic address relocation) 是 在 程序 执行 过 程 中 ,在 CPU 访问 内 存 
之 前 ,将 要 访问 的 程序 或 数据 地 址 转换 成 内 存 地 址 。 动 态 重 定位 依靠 硬件 地 址 变换 机 构 
完成 。 

地 址 重 定位 机 构 需 要 一 个 (或 多 个 ) 基 地 址 寄存 器 BR 和 一 个 (或 多 个 ) 程 序 虚拟 地 址 寄 
存 器 VR。 指 令 或 数据 的 内 存 地 址 MA 与 虚拟 地 址 的 关系 为 

MA= (BR)++ (VR) 
这 里 ,(BR) 与 (VR) 分 别 表 示 寄 存 右 BR 与 VR 中 的 内 容 。 
动态 重 定位 过 程 可 参看 图 5. 3。 


BR | 0| LOAD A500 
"一 一 FE 
VR 
100 
LOAD A500 -+ 500 TY 
| 1500 12345 
500 一 一 一 一 一 一 一 一 一 一 | 
12345 
虚拟 空间 内 存 空间 


图 5.3 动态 地 址 重 定位 


其 具体 过 程 如 下 : 
(1) 设置 基地 址 寄存 器 BR 和 虚拟 地 址 寄存 器 VR。 
(2) 将 程序 段 装 入 内 存 , 且 将 其 占用 的 内 存 区 首 地 址 送 入 BR 中 。 例 如 ,在 图 5.3 中 ， 
(BR)=1000。 
(3) 在 程序 执行 过 程 中 ,将 所 要 访问 的 虚拟 地 址 送 入 VR 中 ,例如 在 图 5. 3 中 执行 
LOAD A 500 语句 时 ,将 所 要 访问 的 虚拟 地 址 500 放 入 VR 中 。 
。 103 。 


(4) 地 址 变换 机 构 把 VR 和 BR 的 内 容 相 加 ,得 到 实际 访问 的 物理 地 址 。 

动态 重 定 位 的 主要 优点 如 下 : 

(1) 可 以 对 内 存 进 行 非 连续 分 配 。 显 然 , 对 于 同一 进程 的 各 分 散 程序 段 ,只 要 把 各 程序 
段 在 内 存 中 的 首 地 址 统一 存放 在 不 同 的 BR 中 ,就 可 以 由 地 址 变换 机 构 变换 得 到 正确 的 内 
存 地 址 。 

(2) 动态 重 定位 提供 了 实现 虚拟 存储 器 的 基础 。 因 为 动态 重 定位 不 要 求 在 作业 执行 前 
为 所 有 程序 分 配 内 存 , 也 就 是 说 ,可 以 部 分 地 ,动态 地 分 配 内 存 。 从 而 ,可 以 在 动态 重 定位 的 
基础 上 ,在 执行 期 间 采 用 请 求 方式 为 那些 不 在 内 存 中 的 程序 段 分 配 内 存 , 以 达到 内 存 扩充 的 
目的 。 

(3) 有 利于 程序 段 的 共享 。 


5.1.3 ”内 外 存 数据 传输 的 控制 


要 实现 内 存 扩充 ,在 程序 执行 过 程 中 ,内 存 和 外 存 之 间 必 须 经 常 地 交换 数据 。 也 就 是 
说 ,把 那些 即将 执行 的 程序 和 数据 段 调 入 内 存 , 而 把 那些 处 于 等 待 状态 的 程序 和 数据 段 调 出 
内 存 。 那 么 , 按 什么 样 的 方式 来 控制 内 存 和 外 存 之 间 的 数据 流动 呢 ? 最 基本 的 控制 办 法 有 
两 种 ,一 种 是 用 户 程序 自己 控制 , 另 一 种 是 操作 系统 控制 。 

用 户 程 序 自己 控制 内 外 存 之 间 的 数据 交换 的 例子 是 覆盖 (overlay)。 覆 盖 技 术 要 求 用 
户 清 楚 地 了 解 程序 的 结构 ,并 指定 各 程序 段 调 人 内 存 的 先后 次 序 。 覆 盖 是 一 种 早期 的 内 存 
扩充 技术 。 使 用 覆盖 技术 ,用 户 负担 很 大 , 且 程 序 段 的 最 大 长 度 仍 受 内 存 容量 限制 。 因 此 ， 
覆盖 技术 不 能 实现 虚拟 存储 器 。 

操作 系统 控制 方式 又 可 进一步 分 为 两 种 ,一 种 是 交换 (swapping) 方 式 , 另 一 种 是 请 求 
调 人 (on demand) 方 式 和 预 调 人 (on prefetch) 方 式 。 

交换 方式 由 操作 系统 把 那些 在 内 存 中 处 于 等 待 状态 的 进程 换 出 内 存 , 而 把 那些 等 待 事 
件 已 经 发 生 、 人 处 于 就 绪 态 的 进程 换 入 内 存 。 

请 求 调 入 方式 是 在 程序 执行 时 ,如 果 所 要 访问 的 程序 段 或 数据 段 不 在 内 存 中 , 则 操作 系 
统 自动 地 从 外 存 将 有 关 的 程序 段 和 数据 段 调 入 内 存 的 一 种 操作 系统 控制 方式 。 而 预 调 入 则 
是 由 操作 系统 预测 在 不 远 的 将 来 会 访问 到 的 那些 程序 段 和 数据 段 部 分 ,并 在 它们 被 访问 之 
前 选择 适当 的 时 机 将 它们 调和 内存 的 一 种 数据 流 控制 方式 。 

由 于 交换 方式 一 般 不 进行 部 分 交换 , 即 每 次 交换 都 交换 那些 除去 常 驻 内 存 部 分 后 的 整 
个 进程 ,而 且 , 即 使 能 完成 部 分 交换 ,也 不 是 按照 执行 的 需要 而 交换 程序 段 , 只 是 把 受 资 源 限 
制 .暂时 不 能 执行 的 程序 段 换 出 内 存 。 因 此 ,虽然 交换 方式 也 能 完成 内 存 扩充 任务 ,但 它 仍 
未 实现 那 种 所 谓 自 动 覆盖 、 内 存 和 外 存 统一 管理 进程 大 小 不 受 内 存 容量 限制 的 虚拟 存储 
器 。 只 有 请 求 调 人 方式 和 预 调和 方式 可 以 实现 进程 大 小 不 受 内 存 容量 限制 的 虚拟 存储 器 。 
有 关 实 现 方法 将 在 后 面 章节 中 讲述 。 


5.1.4 内 存 的 分 配 与 回收 


内 存 的 分 配 与 回收 是 内 存 管理 的 主要 功能 之 一 。 无 论 采 用 哪 一 种 管理 和 控制 方式 ,能 

否 把 外 存 中 的 数据 和 程序 调和 内存 ,取决 于 能 否 在 内 存 中 为 它们 安排 合适 的 位 置 。 因 此 , 存 

储 管理 模块 要 为 每 一 个 并 发 执行 的 进程 分 配 内 存 空间 。 男 外 , 当 进 程 执行 结束 之 后 ,存储 管 
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理 模块 又 要 及 时 回收 该 进程 所 占用 的 内 存 资 源 , 以 便 给 其 他 进程 分 配 空间 。 

为 了 有 效 合理 地 利用 内 存 , 设 计 内 存 的 分 配 和 回收 方法 时 ,必须 考虑 和 确定 以 下 几 种 策 
略 和 数据 结构 : 

(1) 分 配 结构 。 登 记 内 存 使 用 情况 以 及 供 分 配 程序 使 用 的 表格 与 链表 。 例 如 内 存 空闲 
区 表 、 空 闲 区 队列 等 。 

(2) 放置 策略 。 确 定 调 入 内 存 的 程序 和 数据 在 内 存 中 的 位 置 。 这 是 一 种 选择 内 存 空闲 
区 的 策略 。 

(3) 交换 策略 。 在 需要 将 某 个 程序 段 和 数据 段 调 入 内 存 时 ,如 果 内 存 中 没有 足够 的 空 
闲 区 ,由 交换 策略 来 确定 把 内 存 中 的 哪些 程序 段 和 数据 段 调 出 内 存 , 以 便 腾 出 足够 的 空间 。 

(4) 调 入 策略 。 外 存 中 的 程序 段 和 数据 段 什么 时 间 按 什么 样 的 控制 方式 进入 内 存 。 调 
和 人 策略 与 5.1. 3 节 中 所 述 内 外 存 数据 流动 控制 方式 有 关 。 

(5) 回收 策略 。 回 收 策略 包括 两 点 ,一 是 回收 的 时 机 ,二 是 对 所 回收 的 内 存 空闲 区 和 已 
存在 的 内 存 空闲 区 的 调整 。 


5.1.5 内 存 信息 的 共享 与 保护 


内 存 信 息 的 共享 与 保护 也 是 内 存 管理 的 重要 功能 之 一 。 在 多 道 程序 设计 环境 下 ,内 存 
中 的 许多 用 户 程 序 或 系统 程序 和 数据 段 可 供 不 同 的 用 户 进 程 共 享 。 这 种 资源 共享 将 会 提高 
内 存 的 利用 率 。 但 是 , 反 过 来 说 ,除了 被 允许 共享 的 部 分 之 外 ,又 要 限制 各 进程 只 在 自己 的 
存储 区 活动 ,各 进程 不 能 对 别 的 进程 的 程序 和 数据 段 产 生 干 扰 和 破坏 ,因此 必须 对 内 存 中 的 
程序 和 数据 段 采取 保护 措施 。 

常用 的 内 存 信 息 保 护 方法 有 硬件 法 、 软 件 法 和 软 硬 件 结 合法 3 种 。 

上 下 界 保护 法 是 一 种 常用 的 硬件 保护 法 。 上 下 界 存储 保护 技术 要 求 为 每 个 进程 设置 一 
对 上 下 界 寄存 器 ,其 中 装 有 被 保护 程序 和 数据 段 的 起 始 地 址 和 终止 地 址 。 在 程序 执行 过 程 
中 ,在 对 内 存 进 行 访问 操作 时 首先 进行 访 址 合法 性 检查 , 即 。 上 界 寄 存 器 UR 
检查 经 过 重 定位 后 的 内 存 地 址 是 否 在 上 下 界 寄存 器 所 规定 100K en EE 
的 范围 之 内 。 若 在 规定 的 范围 之 内 , 则 访问 是 合法 的 ;和 否则 0 
是 非法 的 ,并 产生 访 址 越界 中 断 。 上 下 界 保护 法 的 保护 原 。 趟 男 罕 存 中 LR。 200K | 一 
理 如 图 5.4 所 示 。 200K 轴 

另外 ,保护 键 法 也 是 一 种 常用 的 存储 保护 法 。 保 护 键 100K 之 被 访问 地 址 < 200K 
法 为 每 一 个 被 保护 存储 块 分 配 一 个 单独 的 保护 键 。 在 程序 “图 5 4 | 下 界 寄存 器 保护 法 
状态 字 中 则 设置 相应 的 保护 键 开关 字 , 对 不 同 的 进程 赋予 
不 同 的 开关 代码 与 被 保护 的 存储 块 中 的 保护 键 匹配 。 保 护 键 可 设置 成 对 读 写 同时 保护 ,也 
可 以 设置 成 只 对 读 或 写 进 行 单项 保护 。 例 如 ,图 5.5 中 的 保护 键 0 就 是 对 2K 到 4K 的 存储 
区 进行 读 写 同时 保护 ,而 保护 键 2 则 只 对 4K 到 6K 的 存储 区 进行 写 保护 。 如 果 开 关 字 与 保 
护 键 匹配 或 存储 块 未 受到 保护 , 则 访问 该 存储 块 是 允许 的 ,否则 将 产生 访问 出 错 中 断 。 

另外 一 种 常用 的 内 存 保护 方式 是 界限 寄存 器 与 CPU 的 用 户 态 或 核心 态 工作 方式 相 结 
合 的 保护 方式 。 在 这 种 保护 方式 下 ,用 户 态 进程 只 能 访问 那些 在 界限 寄存 器 所 规定 范围 内 
的 内 存 部 分 ,而 核心 态 进 程 则 可 以 访问 整个 内 存 地 址 空间 。UNIX 系统 就 是 采用 的 这 种 内 
存 保护 方式 。 
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当前 程序 状态 字 


. 2 | 
2KF 一 i 开关 字 
4K 正确 访问 
ok 2| W | LOAD 1 5000 非 读 保护 
STORE 2 5200 ”开关 字 和 保护 键 匹配 
内 存 非 正确 访问 
LOAD ”1 2500 ”出 错 , 开关 字 和 保护 键 不 匹配 


图 5.5 保护 键 保护 法 


5.2 分 区 存储 管理 


分 区 管理 是 把 内 存 划 分 成 若干 个 大 小 不 等 的 区 域 , 除 操作 系统 占用 一 个 区 域 之 外 ,其 余 
由 多 道 环 境 下 的 各 并 发 进程 共享 。 分 区 管理 是 满足 多 道 程序 设计 的 一 种 最 简单 的 存储 管理 
方法 。 

下 面 结合 分 区 原理 来 讨论 分 区 存储 管理 时 的 虚 存 实现 .地址 变换 、 内 存 的 分 配 与 释放 以 
及 内 存 信息 的 共享 与 保护 等 问题 。 


5.2.1 分 区 管理 基本 原理 


分 区 管理 的 基本 原理 是 给 每 一 个 内 存 中 的 进程 划分 一 块 适当 大 小 的 存储 区 ,以 连续 存 
储 各 进程 的 程序 和 数据 ,使 各 进程 得 以 并 发 执行 。 按 分 区 的 时 机 ,分 区 管理 可 以 分 为 固定 分 
区 和 动态 分 区 两 种 方法 。 

1. 固定 分 区 法 

固定 分 区 法 就 是 把 内 存 固定 地 划分 为 若干 个 大 小 不 等 的 区 域 。 分 区 划分 的 原则 由 一 般 
系统 操作 员 或 操作 系统 决定 。 例 如 可 划分 为 长 作业 分 区 和 短 作 业 分 区 。 分 区 一 旦 划分 结 
束 ,在 整个 执行 过 程 中 每 个 分 区 的 长 度 和 内 存 的 总 分 区 个 数 将 保持 不 变 。 

系统 对 内 存 的 管理 和 控制 通过 数据 结构 一 一 分 区 说 明 表 进行 ,分 区 说 明 表 说 明 各 分 区 
号 ,分 区 大 小 、 起 始 地 址 和 是 否 是 空闲 区 (分 区 状态 )。 内 存 的 分 配 释放 、 存 储 保护 以 及 地 址 
变换 等 都 通过 分 区 说 明 表 进行 。 图 5.6 给 出 了 固定 分 区 时 分 区 说 明 表 和 对 应 内 存 状态 的 
例子 。 

图 中 ,操作 系统 占用 低地 址 部 分 的 20K ,其 余 空 间 被 划分 为 4 个 分 区 ,其 中 1.2、3 号 分 
区 已 分 配 ,4 号 分 区 未 分 配 。 

2. 动态 分 区 法 

与 固定 分 区 法 相 比 ,动态 分 区 法 在 作业 执行 前 并 不 建立 分 区 ,分 区 的 建立 是 在 作业 的 处 
理 过 程 中 进行 的 , 且 其 大 小 可 随 作业 或 进程 对 内 存 的 要 求 而 改变 。 这 就 改变 了 固定 分 区 法 
中 那 种 即使 是 小 作业 也 要 占据 大 分 区 的 浪费 现象 ,从 而 提高 了 内 存 的 利用 率 。 

采用 动态 分 区 法 ,在 系统 初 启 时 ,除了 操作 系统 中 常 驻 内 存 部 分 之 外 ,只 有 一 个 空闲 分 
区 。 随 后 ,分 配 程序 将 该 区 依次 划分 给 调度 选中 的 作业 或 进程 。 图 5.7 给 出 了 FIFO 调度 
方式 时 的 内 存 初始 分 配 情况 。 

随 着 进程 的 执行 ,会 出 现 一 系列 的 分 配 和 释放 。 如 在 某 一 时 刻 , 进程 C 执行 结束 并 释 
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图 5.6 固定 分 区 法 


5 操作 系统 
区 号 | 分 区 长 度 | 起 始 地 址 | 状态 | 进程 A(6K) | 第 1 分 区 
1 8K 20K | 已 分 配 28K 2 
2 | 32K | 28K | 已 分 配 进程 BO5K) | 第 2 分 区 
es 
3 64K 60K “| 已 分 配 60K ZN 
进程 CG6K) | | 第 3 分 区 
4 | 132K 124K “| 未 分 配 ZT 区 
124K 
下 个 | 第 4 分 区 
256K 
(a) 分 区 说 明 表 (b) 内 存 状态 


| 
16K 64K 124K 
OS OS OS 
进程 A 进程 A 进程 A 
进程 B 进程 B 进程 B 
进程 C 进程 C 
AZ 】 进程 D 


图 5.7 内 存 初始 分 配 情况 


放 内 存 之 后 ,管理 程序 又 要 为 男 两 个 进程 E( 设 需 内 存 50K) 和 F( 设 需 内 存 16K) 分 配 内 存 。 
如 果 分 配 的 空闲 区 比 所 要 求 的 大 , 则 管理 程序 将 该 空闲 区 分 成 两 个 部 分 ,其 中 一 部 分 成 为 已 
分 配 区 ,而 另 一 部 分 成 为 一 个 新 的 小 空闲 区 。 图 5. 8 给 出 了 采用 最 先 适应 算法 (first fit) 分 
配 内 存 时 进程 己 和 进程 下 得 到 内 存 以 及 进程 B 和 进程 D 释放 内 存 的 内 存 分 配 变化 过 程 。 
如 图 5.8 所 示 ,在 管理 程序 回收 内 存 时 ,如 果 被 回收 分 区 有 和 它 邻 接 的 空闲 分 区 存在 , 则 要 


进行 合并 。 


0[ 操作 系统 0 | 操作 系统 0 操作 系统 
A(8K) A(8K) A(8K) 
B(16K) B(16K) 16K 空闲 区 
C 完 成 “| 进程 ESOK) | EC | 进程 HII6K) | Eco | 

64K 空闲 区 | 进程 FI6K) | 14K 空 闲 区 | 进程 D(124K) | ”空闲 合并 
进入 内 存 完成 124K+14K 
D(124K) > D(124K) =138K 
F(16K, 
24K 空闲 区 人 全 
256K 256K LSK 空闲 区 256K L 8K 空 闻 区 
内 存 内 存 内 存 


图 5.8 内 存 分 配 变化 过 程 


二 


与 固定 分 区 法 相同 ,动态 分 区 法 也 要 使 用 分 区 说 明 表 等 数据 结构 对 内 存 进行 管理 。 除 
了 分 区 说 明 表 之 外 ,动态 分 区 法 还 把 内 存 中 的 可 用 分 区 单独 构成 可 用 分 区 表 或 可 用 分 区 自 
由 链 , 以 描述 系统 内 的 内 存 资源 。 与 此 相对 应 ,请 求 内 存 资 源 的 作业 或 进程 也 构成 一 个 内 存 
资源 请 求 表 。 图 5. 9 给 出 了 可 用 表 、 自 由 链 和 请 求 表 的 例子 。 


区 区 长 度 [ 起 始 地 址 | | 40K |-=| 16K | 78K 一 
号 | 风 区 从 必定 多 地 | 作业 (进程 ) 号 | 请求 长度 
1 16K 40K 泌 J | 请 
3 24K 78K Pp 20K 
5 oK 100K 24K | 100K 七 
泌 十 | 
(a) 可 用 表 (b) 自由 链 (c) 请 求 表 


图 5.9 可 用 表 、 自 由 链 及 请 求 表 


可 用 表 的 每 个 表 目 记录 一 个 空闲 区 ,主要 参数 包括 区 号 ,分 区 长 度 和 起 始 地 址 。 采 用 表 
格 结构 ,管理 过 程 比较 简单 ,但 表 的 大 小 难以 确定 ,要 占用 一 部 分 内 存 。 

自由 链 则 是 利用 每 个 内 存 空 闲 区 的 头 几 个 单元 存放 本 空闲 区 的 大 小 及 下 个 空闲 区 的 起 
始 地 址 ,从 而 把 所 有 的 空闲 区 链接 起 来 。 然 后 ,系统 再 设置 一 个 自由 链 首 指针 让 其 指向 第 一 
个 空闲 区 ,这样 ,管理 程序 可 通过 链 首 指针 查 到 所 有 的 空闲 区 。 采 用 自由 链 法 管理 空闲 区 ， 
查找 时 要 比 可 用 表 困 难 ,但 由 于 自由 链 指针 是 利用 空闲 区 自身 的 单元 ,所 以 不 必 占 用 额外 的 
内 存 区 。 

请 求 表 的 每 个 表 目 描述 请 求 内 存 资源 的 作业 或 进程 号 以 及 所 请 求 的 内 存 大 小 。 

无 论 是 采用 可 用 表 方 式 还 是 自由 链 方式 ,可 用 表 或 自由 链 中 的 各 个 项 都 要 按照 一 定 的 
规则 排列 ,以 利 查找 和 回收 。 下 面 讨论 分 区 法 的 分 区 分 配 与 回收 问题 。 


5.2.2 分 区 的 分 配 与 回收 


1. 固定 分 区 时 的 分 配 与 回收 

固定 分 区 法 时 的 内 存 分 配 与 回收 较为 简单 , 当 用 户 程序 要 装 和 人 执行 时 ,通过 请 求 表 提出 
内 存 分 配 要 求 和 所 要 求 的 内 存 空间 大 小 。 存 储 管理 程序 根据 请 求 表 查 询 分 区 说 明 表 ,从 中 
找 出 一 个 满足 要 求 的 空闲 分 区 ,并 将 其 分 配给 申请 者 。 固 定 分 区 时 的 分 配 算法 如 图 5. 10 
所 示 。 

固定 分 区 的 回收 更 加 简单 。 当 进程 执行 完毕 ,不 再 需要 内 存 资源 时 ,管理 程序 将 对 应 的 
分 区 状态 置 为 未 使 用 即 可 。 

2. 动态 分 区 时 的 分 配 与 回收 

动态 分 区 时 的 分 配 与 回收 主要 解决 3 个 问题 : 

(1) 对 于 请 求 表 中 的 要 求 内 存 长 度 , 从 可 用 表 或 自由 链 中 寻找 出 合适 的 空闲 区 分 配 


程序 。 

(2) 分 配 空闲 区 之 后 ,更 新 可 用 表 或 自由 链 。 

(3) 进程 或 作业 释放 内 存 资 源 时 , 和 相 邻 的 空闲 区 进行 链接 合并 ,更 新 可 用 表 或 自 

由 链 。 
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要 求 按 SIZE 大 小 分 


[Xl 


1 
取 分 区 说 明 表 第 一 项 


无 法 分 配 


取 下 一 表 项 


返回 分 区 号 


图 5.10 固定 分 区 时 的 分 配 算法 


从 可 用 表 或 自由 链 中 寻找 空闲 区 的 常用 方法 有 3 种 : 最 先 适应 算法 (first fit algorithm)、 
最 佳 适应 算法 (best fit algorithm) 和 最 坏 适 应 算法 (worst fit algorithm)。 这 3 种 方法 要 求 
可 用 表 或 自由 链 按 不 同 的 方式 排列 。 下 面 分 别 介绍 这 3 种 方法 。 

1) 最 先 适 应 算法 

最 先 适 应 算法 要 求 可 用 表 或 自由 链 按 起 始 地 址 递增 的 次 序 排列 。 该 算法 的 最 大 特点 是 
一 旦 找到 大 于 或 等 于 所 要 求 内 存 长 度 的 分 区 , 则 结束 探索 。 然 后 ,该 算法 从 所 找到 的 分 区 中 
划 出 所 要 求 的 内 存 长 度 分 配给 用 户 ,并 把 余下 的 部 分 进行 合并 (如 果 有 相 邻 空闲 区 存在 ) 后 
留 在 可 用 表 中 ,但 要 修改 其 相应 的 表 项 。 最 先 适应 算法 如 图 5. 11 所 示 。 

2) 最 佳 适应 算法 

最 佳 适应 算法 要 求 按 从 小 到 大 的 次 序 组 成 空闲 区 可 用 表 或 自由 链 。 当 用 户 作 业 或 进程 
申请 一 个 空闲 区 时 ,存储 管理 程序 从 表 头 开始 查找 , 当 找 到 第 一 个 满足 要 求 的 空闲 区 时 , 停 
止 查找 。 如 果 该 空闲 区 大 于 请 求 表 中 的 请 求 长 度 , 则 与 最 先 适 应 算法 时 相同 ,将 减 去 请 求 长 
度 后 的 剩余 空闲 区 部 分 留 在 可 用 表 中 。 

3) 最 坏 适应 算法 

最 坏 适 应 算法 要 求 空闲 区 按 其 大 小 递减 的 顺序 组 成 空闲 区 可 用 表 或 自由 链 。 当 用 户 作 
业 或 进程 申请 一 个 空闲 区 时 , 先 检查 空闲 区 可 用 表 或 自由 链 的 第 一 个 空闲 可 用 区 的 大 小 是 
否 大 于 或 等 于 所 要 求 的 内 存 长 度 , 若 可 用 表 或 自由 链 的 第 一 个 项 长 度 小 于 所 要 求 的 , 则 分 配 
失败 ,否则 从 空闲 区 可 用 表 或 自由 链 中 分 配 相 应 的 存储 空间 给 用 户 ,然后 修改 空闲 区 可 用 表 
或 自由 链 。 

读者 可 以 自行 画 出 最 佳 适应 法 和 最 坏 适 应 法 的 流程 框图 。 

" 998 硬 


请 求 SIZE 大 小 的 分 区 | 


从 空闲 区 表 第 一 项 
开始 按 顺序 查找 


取 下 一 表 项 


该 空间 区 
长 度 =SIZE? 


pee 
需 大 小 ， 修 改 可 


从 可 用 表 中 移 去 该 
表 项 ， 修 改 可 用 表 


返回 分 配 起 始 地 址 


图 5.11 最 先 适 应 算法 


3. 动态 分 区 时 的 回收 与 拼接 

当 用 户 作 业 或 进程 执行 结束 时 ,存储 管理 程序 要 收回 已 使 用 完毕 的 空闲 区 ( 称 为 释放 
区 ) ,并 将 其 插入 空闲 区 可 用 表 或 自由 链 。 这 里 ,在 将 回收 的 空闲 区 插入 可 用 表 或 自由 链 时 ， 
和 分 配 空 闲 区 时 一 样 , 也 要 遇 到 剩余 空闲 区 拼接 问题 。 如 果 不 对 空闲 区 进行 拼接 , 则 由 于 每 
个 作业 或 进程 所 要 求 的 内 存 长 度 不 一 样 而 出 现 大 量 分 散 、 较 小 的 空闲 区 。 这 就 造成 大 量 的 
内 存 浪费 。 解 决 这 个 问题 的 办 法 之 一 就 是 在 空闲 区 回收 时 或 在 内 存 分 配 时 进行 空闲 区 拼 
接 , 以 把 不 连续 的 零散 空闲 区 集中 起 来 。 

在 将 一 个 新 的 空闲 区 插入 可 用 表 或 自由 链 时 ,该 空 闻 区 和 上 下 相 邻 区 的 关系 是 下 述 4 
种 关系 之 一 (如 图 5. 12 所 示 ) 。 


/1/77 | 
上 空闲 区 上 空闲 区 | /LALAL | //// 
| 


空闲 区 NA 下 空闲 区 大 7 
///7 


(a) 上 下 相 邻 (b) 上 相 邻 区 (c) 下 相 邻 区 (d) 上 下 相 邻 
都 是 空闲 为 空闲 区 为 空闲 区 不 是 空闲 


图 5.12 空闲 区 的 合并 


BA 区 


(1) 该 空闲 区 的 上 下 两 相 邻 分 区 都 是 空闲 区 。 
(2) 该 空闲 区 的 上 相 邻 区 是 空闲 区 。 
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(3) 该 空闲 区 的 下 相 邻 区 是 空闲 区 。 

(4) 该 空闲 区 的 上 下 两 相 邻 区 都 不 是 空闲 区 。 

对 于 上 述 4 种 情况 ,如 果 释 放 区 与 上 下 两 空闲 区 相 邻 , 则 将 3 个 空闲 区 合并 为 一 个 空闲 
区 ,新 空闲 区 的 起 始 地 址 为 上 空闲 区 的 起 始 地 址 ,大 小 为 3 个 空闲 区 之 和 。 空 闲 区 合并 后 ， 
取消 可 用 表 或 自由 链 中 下 空闲 区 的 表 项 或 链 指针 ,修改 上 空闲 区 的 对 应 项 。 

如 果 释 放 区 只 与 上 空闲 区 相 邻 , 则 将 释放 区 与 上 空闲 区 合并 为 一 个 空闲 区 ,其 起 始 地 
为 上 空闲 区 的 起 始 地 址 ,大 小 为 上 空闲 区 与 释放 区 之 和 。 合 并 后 ,修改 上 空 ee 
表 的 表 项 或 自由 链 指针 。 

如 果 释 放 区 与 下 空闲 区 相 邻 , 则 将 释放 区 与 下 空闲 区 合并 ,并 将 释放 区 的 起 始 地址 作为 
合并 区 的 起 始 地 址 ,合并 区 的 长 度 为 释放 区 与 下 空闲 区 之 和 。 同 理 , 合 并 后 修改 可 用 表 或 自 
由 链 中 相应 的 表 项 或 链 指针 。 

如 果 释 放 区 不 与 任何 空闲 区 相 邻 , 则 释放 区 作为 一 个 新 的 空闲 可 用 区 插 人 可 用 表 或 自 
链 。 读 者 可 以 自行 写 出 动态 分 区 时 的 回收 算法 。 

4. 几 种 分 配 算法 的 比较 

上 面 讨 论 了 3 种 常用 的 内 存 分 配 算法 及 回收 算法 。 由 于 回收 后 的 空闲 区 要 插入 可 用 表 
或 自由 链 中 ,而 且 可 用 表 或 自由 链 是 按照 一 定 顺 序 排列 的 ,所 以 ,除了 搜索 查找 速度 以 及 所 
找到 的 空闲 区 是 否 最 佳 以 外 ,释放 空闲 区 的 速度 也 对 系统 开销 产生 影响 。 下 面 从 查找 速度 、 
释放 速度 及 空闲 区 的 利用 3 个 方面 对 上 述 3 种 算法 进行 比较 。 

首先 ,从 搜索 速度 上 看 ,最 先 适应 算法 具有 最 佳 性 能 。 尽 管 最 佳 适应 算法 或 最 坏 适 应 算 
法 看 上 去 能 很 快 地 找到 一 个 最 适合 的 或 最 大 的 空闲 区 ,但 后 两 种 算法 都 要 求 首 先 把 大 小 不 
同 的 空闲 区 按 其 大 小 进行 排队 ,这 实际 上 是 对 所 有 空闲 区 进行 一 次 搜索 。 再 者 ,从 回收 过 程 
来 看 ,最 先 适 应 算法 也 是 最 佳 的 。 因 为 使 用 最 先 适 应 算法 回收 某 一 空闲 区 时 ,无论 被 释放 区 
是 否 与 空闲 区 相 邻 ,都 不 用 改变 该 区 在 可 用 表 或 自由 链 中 的 位 置 ,只 需 修 改 其 大 小 或 起 始 地 
址 。 而 最 佳 适 应 算法 和 最 坏 适 应 算法 都 必须 重新 调整 该 区 的 位 置 。 

最 先 适 应 算法 的 另 一 个 优点 就 是 尽 可 能 地 利用 了 低地 址 空间 ,从 而 保证 高 地 址 有 较 大 
的 空闲 区 来 放置 要 求 内 存 较 多 的 进程 或 作业 。 

反 过 来 ,最 佳 适 应 法 找到 的 空闲 区 是 最 佳 的 ,也 就 是 说 ,用 最 佳 适 应 法 找到 的 空闲 区 或 
者 是 正好 等 于 用 户 请 求 的 大 小 或 者 是 能 满足 用 户 要 求 的 最 小 空闲 区 。 不 过 ,尽管 最 佳 适应 
法 能 选 出 最 适合 用 户 要 求 的 可 用 空闲 区 ,但 这 样 做 在 某 些 情况 下 并 不 一 定 能 提高 内 存 的 利 
用 率 。 例 如 , 当 用 户 请 求 小 于 最 小 空闲 区 不 太 多 时 ,分 配 程序 会 将 其 分 配 后 的 剩余 部 分 作为 

一 个 新 的 小 空闲 区 留 在 可 用 表 或 自由 链 中 。 这 种 小 空闲 区 有 可 能 永远 得 不 到 再 利用 (除非 
与 别 的 空闲 区 合并 ) ,而 且 也 会 增加 内 存 分 配 和 回收 时 的 查找 负担 。 

最 坏 适 应 算法 正 是 基于 不 留 下 碎片 空闲 区 这 一 出 发 点 的 , 它 选 择 最 大 的 空闲 区 来 满足 
用 户 要 求 , 以 期 分 配 后 的 剩余 部 分 仍 能 进行 再 分 配 。 

总 之 ,上 述 3 种 算法 各 有 特长 ,针对 不 同 的 请 求 队列 ,效率 和 功能 是 不 一 样 的 。 


5.2.3 有关 分 区 管理 其 他 问题 的 讨论 


1. 关于 虚 存 的 实现 
利用 分 区 式 管理 ,也 同样 存在 每 个 用 户 可 以 自由 编程 的 虚拟 空间 。 但 是 ,分 区 式 管理 方 
a 


式 无 法 实现 那 种 用 户 进 程 所 需 内 存 容量 只 受 内 存 和 外 存 容量 之 和 限制 的 虚拟 存储 器 。 事 实 
上 ,如 果 不 采用 内 存 扩充 技术 ,每 个 用 户 进程 所 需 内 存 容量 是 受到 分 区 大 小 限制 的 ,这 一 点 
从 上 面 的 讨论 中 可 以 看 出 。 

2. 关于 内 存 扩充 

由 于 分 区 式 管 理 时 各 用 户 进程 或 作业 所 要 求 的 内 存 容 量 受到 分 区 大 小 的 限制 ,如 果 不 
采用 内 存 扩充 技术 ,将 会 极 大 地 限制 分 区 式 管理 技术 的 使 用 。 在 分 区 式 管 理 中 ,可 以 使 用 覆 
盖 或 交换 技术 来 扩充 内 存 。 有 关 覆 盖 和 交换 技术 的 基本 原理 ,将 在 5. 3 节 中 讨论 。 

3. 关于 地 址 变换 和 内 存 保护 

静态 地 址 重 定位 和 动态 地 址 重 定位 技术 都 可 用 来 完成 分 区 式 内 存 管理 的 地 址 变换 。 显 
然 ,动态 分 区 时 分 区 大 小 不 固定 ,而 空闲 区 的 拼接 会 移动 内 存 中 的 程序 和 数据 ,因此 ,使 用 天 
态 地 址 重 定位 的 方法 来 完成 动态 分 区 时 的 地 址 变换 是 不 妥当 的 。 

在 进行 动态 地 址 重 定位 时 ,每 个 分 区 需要 一 对 硬件 寄存 器 的 支持 , 即 基 址 寄存 器 和 限 长 
寄存 器 ,分 别 用 来 存放 作业 或 进程 在 内 存 分 区 的 起 始 地 址 和 长 度 。 这 一 对 硬件 寄存 器 除了 
完成 动态 地 址 重 定 位 的 功能 之 外 ,还 具有 保护 内 存 中 数据 和 程序 的 功能 。 这 由 硬件 检查 
CPU 执行 指令 所 要 访问 的 虚拟 地 址 完成 。 即 设 CPU 指令 所 要 访问 的 虚拟 地 址 为 D, 若 
D>>VR(CVR 是 限 长 寄存 器 中 的 限 长 值 ) , 则 说 明 地 址 越界 ,所 要 访问 的 内 存 地 址 超出 了 该 作 
业 或 进程 所 占用 的 内 存 空间 。 这 时 将 产生 保护 中 断 , 系 统 转 去 进行 出 错 处 理 。 若 D<VR， 
则 该 地 址 是 合法 的 ,由 硬件 完成 对 该 虚拟 地 址 的 动态 重 定位 。 

保护 键 法 也 可 用 来 对 内 存 各 分 区 提供 保护 。 

4. 分 区 存储 管理 的 主要 优 缺 点 

分 区 存储 管理 的 主要 优点 如 下 : 

(1) 实现 了 多 个 作业 或 进程 对 内 存 的 共享 ,有 助 于 多 道 程 序 设 计 , 从 而 提高 了 系统 的 资 


源 利 用 率 。 
(2) 该 方法 要 求 的 硬件 支持 少 , 管 理 算法 简单 ,因而 实现 容易 。 
其 主要 缺点 如 下 : 


(GD) 内 存 利 用 率 仍然 不 高 。 和 单一 连续 分 本 算法 一 样 ,内 存 中 可 能 含有 从 未 用 过 的 信 
息 。 而 且 ,还 存在 着 严重 的 碎 小 空闲 区 (碎片 ) 不 能 利用 的 间 题 ,这 更 进一步 影响 了 内 存 的 利 
用 率 。 
(2) 作业 或 进程 的 大 小 受 分 区 大 小 控制 ,除非 配合 采用 覆盖 和 交换 技术 。 
(3) 无 法 实现 各 分 区 间 的 信息 共享。 


5.3 ”覆盖 与 交换 技术 


覆盖 与 交换 技术 是 在 多 道 环境 下 用 来 扩充 内 存 的 两 种 方法 。 履 盖 技 术 主 要 用 在 早期 的 
操作 系统 中 ,而 交换 技术 则 在 现代 操作 系统 中 仍 具有 和 较 强 的 生命 力 。 下 面 主要 介绍 覆盖 与 
交换 的 基本 思想 。 


5.3.1 覆盖 技术 


覆盖 技术 是 基于 这 样 一 种 思想 提出 来 的 , 即 一 个 程序 并 不 需要 一 开始 就 把 它 的 全 部 指 
* 了 


令 和 数据 都 装 和 人 内存 后 再 执行 。 在 单 CPU 系统 中 ,每 一 时 刻 事实 上 只 能 执行 一 条 指令 。 
因此 ,不 妨 把 程序 划分 为 若干 个 功能 上 相对 独立 的 程序 段 ,按照 程序 的 逻辑 结构 让 那些 不 会 
同时 执行 的 程序 段 共享 同一 块 内 存 区 。 通 常 ,这 些 程序 段 都 被 保存 在 外 存 中 , 当 有 关 程 序 段 
的 先头 程序 段 执行 结束 后 ,再 把 后 续 程 序 段 调 入 内存 履 盖 前 面 的 程序 段 。 这 使 得 用 户 看 来 ， 
好 像 内 存 扩 大 了 ,从 而 达到 了 内 存 扩充 的 目的 。 

但 是 ,覆盖 技术 要 求 程序 员 提 供 一 个 清楚 的 覆盖 结构 , 即 程序 员 必须 完成 把 一 个 程序 划 
分 成 不 同 的 程序 段 ,并 规定 好 它们 的 执行 和 覆盖 顺序 的 工作 。 操 作 系统 根据 程序 员 提 供 的 

at 一 般 来 说 ,一 个 程序 究竟 可 以 划分 为 多 少 段 ,以 及 让 其 

中 的 哪些 程序 共享 哪 一 内 存 区 只 序 员 清 楚 。 这 要 求 程 序 员 既 要 清楚 地 了 解 程序 所 属 进 
程 的 虚拟 空间 及 各 程序 Shanti 又 要 求 程序 员 懂 得 系统 和 内 存 的 内 部 结构 
与 地 址 划分 ,因此 ,程序 员 负 担 较 重 。 所 以 ,覆盖 技术 大 多 限于 对 操作 系统 的 虚空 间 和 内 部 
结构 很 熟悉 的 程序 员 使 用 。 

例如 , 设 某 进程 的 程序 正文 段 由 A、B.C、D、E 和 下 共 6 个 程序 段 组 成 。 它 们 之 间 的 调 
用 关系 如 图 5. 13(a) 所 示 ,程序 段 A 调用 程序 段 B 和 C, 程 序 段 B 又 调用 程序 段 , 程 序 段 C 
调用 程序 段 D 和 下 。 

由 图 5. 13(a) 可 以 看 出 ,程序 段 B 不 会 调用 C ,程序 段 C 也 不 会 调用 B。 因 此 ,程序 段 B 
和 C 无须 同 时 驻 留 在 内 存 , 它 们 可 以 共享 同一 内 存 区 。 同 理 , 程 序 段 DE\F 也 可 共享 同一 
内 存 区 。 其 覆盖 结构 如 图 5. 13(b) 所 示 。 


A Oa 
常 驻 部 分 20K 
20K 0k - 
50K 
B C 70K 一 
50K 30K 覆盖 区 1 
40K 
110K 
F D E 
30K 20K | | 40K 
(a) 程序 段 之 间 的 调用 关系 (b) 覆盖 结构 
图 5.13 覆盖 示例 


在 图 5. 13(b) 中 ,整个 程序 正文 段 被 分 为 两 个 部 分 。 一 个 是 常 驻 内 存 部 分 ,该 部 分 与 所 
有 的 被 调用 程序 段 有 关 , 因 而 不 能 被 覆盖 。 这 一 部 分 称 为 根 程序 。 图 5. 13(b) 中 ,程序 段 A 
是 根 程序 。 另 一 部 分 是 覆盖 部 分 ,图 中 被 分 为 两 个 覆盖 区 。 其 中 ,一 个 覆盖 区 由 程序 段 B 
和 C 共享 。 其 大 小 为 B.C 中 所 要 求 容量 大 者 。 另 一 个 覆盖 区 为 程序 段 F.D、E 共享 。 两 个 
覆盖 区 的 大 小 分 别 为 50K 与 40K。 这 样 , 虽 然 该 进程 正文 段 所 要 求 的 内 存 空间 是 20K 十 
50K 十 30K 十 30K 十 20K 十 40K 王 190K ,但 由 于 采用 了 覆盖 技术 ,只 需 110K 的 内 存 空 间 即 可 
开始 执行 。 


5.3.2 交换 技术 


在 多 道 程序 环境 或 分 时 系统 中 ,同时 执行 好 几 个 作业 或 进程 。 但 是 ,这 些 同 时 存在 于 内 
存 中 的 作业 或 进程 ,有 的 处 于 执行 状态 或 就 绪 状 态 ,而 有 的 则 处 于 等 待 状态 。 
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一 般 来 说 ,等 待 时 间 比 较 长 。 例 如 从 外 存 软 磁盘 读 一 块 数据 到 内 存 有 时 要 花 0. 1s 到 1s 
左右 的 时 间 。 如 果 让 这 些 等 待 中 的 进程 继续 驻 留 内 存 , 将 会 造成 存储 空间 的 浪费 。 因 此 ,应 
该 把 处 于 等 待 状态 的 进程 换 出 内 存 。 

实现 上 述 目标 的 方法 很 多 ,其 中 比较 常用 的 方法 之 一 就 是 交换 。 广 义 地 说 ,交换 是 指 先 
将 内 存 某 部 分 的 程序 或 数据 写 人 外 存 交 换 区 ,再 从 外 存 交 换 区 中 调和 人 指定 的 程序 或 数据 到 
内 存 中 来 ,并 让 其 执行 的 一 种 内 存 扩充 技术 。 与 覆盖 技术 相 比 ,交换 不 要 求 程序 员 给 出 程序 
段 之 间 的 覆盖 结构 。 而 且 , 交 换 主 要 是 在 进程 或 作业 之 间 进 行 ,而 覆盖 则 主要 在 同一 个 作业 
或 进程 内 进行 。 另 外 ,只 能 对 那些 与 覆盖 程序 段 无 关 的 程序 段 进 行 覆 盖 。 

交换 进程 由 换 出 和 换 和 人 两 个 过 程 组 成 。 其 中 换 出 (swap out) 过 程 把 内 存 中 的 数据 和 程 
序 换 到 外 存 交 换 区 ,而 换 入 (swap in) 过 程 把 外 存 交 换 区 中 的 数据 和 程序 换 到 内 存 分 区 中 。 

换 出 过 程 和 换 入 过 程 都 要 完成 与 外 存 设备 管理 进程 通信 的 任务 。 由 交换 进程 发 送 给 设 
备 进 程 的 消息 m 中 应 包含 分 区 的 分 区 号 i 该 分 区 的 基 址 base; .长 度 size; 和 方向 及 外 存 交 
换 区 中 分 区 起 始 地 址 。 交 换 进 程 和 设备 管理 进程 通过 设备 缓冲 队列 进行 通信 。 换 出 过 程 
SWAPOUT 可 描述 如 下 : 


SWAPOUT (i): 

begin local m 
m.base<-basei; 
m.ceiling<-basei+sizei; 
m.direction<-"out"; 
m.destination<-base of free area on swap area; 
backupstorebasei<m.destination; 
send((m,i),device queue); 


end 


在 SWAPOUT(i) 中 ,除了 前 5 行 描述 所 需要 的 控制 信息 之 外 ,backupstorbase; 是 用 来 
记录 被 换 出 数据 和 程序 的 起 始 地 址 以 便 换 入 时 使 用 的 。 而 send 指令 则 驱动 设备 做 相应 的 
数据 读 写 操作 。 

与 SWAPOUT 过 程 相同 ,可 以 写 出 SWAPIN 过 程 : 


SWAPIN (i): 

begin local m 
nm.base<basei; 
m.ceiling< basei+sizei; 
m.direction<—"in"; 
m.source< backupstorebasei 
send((m,i),device queue); 


end 
交换 技术 大 多 用 在 小 型 机 或 微机 系统 中 ,这 样 的 系统 大 部 分 采用 固定 的 或 动态 分 区 方 
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5.4 页 式 管 理 


5.4.1 页 式 管理 的 基本 原理 


上 面 几 节 中 ,已 经 讨论 了 分 区 式 存 储 管理 方法 及 支持 分 区 式 管理 的 覆盖 与 交换 技术 。 
事实 上 ,分 区 式 管理 方式 尽管 实现 方式 较为 简单 ,但 存在 着 严重 的 碎片 问题 使 得 内 存 的 利用 
率 不 高 。 再 者 ,分 区 式 管理 时 ,由 于 各 作业 或 进程 对 应 于 不 同 的 分 区 以 及 在 分 区 内 各 作业 或 
进程 连续 存放 ,进程 的 大 小 仍 受 分 区 大 小 或 内 存 可 用 空间 的 限制 。 而 且 , 分 区 式 管理 也 不 利 
于 程序 段 和 数据 的 共享 。 页 式 管理 正 是 为 了 减少 碎片 以 及 为 了 只 在 内 存 存放 那些 反复 执行 
或 即将 执行 的 程序 段 与 数据 部 分 ,而 把 那些 不 经 常 执行 的 程序 段 和 数据 存放 于 外 存 , 待 执行 
时 调和 人 ,以 提高 内 存 利用 率 而 提出 来 的 。 

页 式 管理 的 基本 原理 如 下 : 

首先 ,各 进程 的 虚拟 空间 被 划分 成 若干 个 长 度 相 等 的 页 (page) 。 页 长 的 划分 和 内 存 、 外 
存 之 间 的 数据 传输 速度 以 及 内 存 大 小 等 有 关 。 一 般 每 个 页 长 大 约 为 1 长 一 4K, 经 过 页 划分 
之 后 ,进程 的 虚 地 址 变 为 页 号 P 与 页 内 地 址 W 所 组 成 。 例 如 ,一 个 页 长 为 1K, 拥 有 1024 页 
的 虚拟 空间 地 址 结构 如 图 5. 14 所 示 。 
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页 号 | 页 内 地 址 W 


图 5.14 页 的 划分 


除了 把 进程 的 虚拟 空间 划分 为 大 小 相等 的 页 之 外 ,页 式 管理 还 把 内 存 空 间 也 按 页 的 大 
小 划分 为 片 或 页 面 (page frame)。 这 些 页 面 为 系统 中 的 任 一 进程 所 共享 (除去 操作 系统 区 
外 )。 从 而 ,与 分 区 管理 不 一 样 ,分 页 管理 时 ,用 户 进 程 在 内 存 空间 内 除了 在 每 个 页 面 内 地 址 
连续 之 外 ,每 个 页 面 之 间 不 再 连续 。 页 式 管理 有 以 下 两 个 优点 。 第 一 是 实现 了 内 存 中 碎片 
的 减少 ,因为 任 一 碎片 都 会 小 于 一 个 页 面 。 第 二 是 实现 了 由 连续 存储 到 非 连续 存储 这 个 飞 
跃 ,为 在 内 存 中 局 部 地 ,动态 地 存储 那些 反复 执行 或 即将 执行 的 程序 和 数据 段 打下 了 基础 。 

那么 ,怎样 由 页 式 虚拟 地 址 变换 为 内 存 页 面 物理 地 址 呢 ? 页 式 管理 把 页 式 虚 地 址 与 内 
存 页 面 物理 地 址 建立 一 一 对 应 的 页 表 , 并 用 相应 的 硬件 地 址 变换 机 构 来 解决 离散 地 址 变换 
问题 。 页 表 方 式 实质 上 是 动态 重 定 位 技术 的 一 种 延伸 ,这 一 点 在 后 面 的 介绍 中 可 以 看 到 。 

再 者 ,页 式 管 理 采 用 请 求 调 页 或 预 调 页 技术 实现 了 内 外 存储 器 的 统一 管理 。 即 内 存 内 
只 存放 那些 经 常 被 执行 或 即将 被 执行 的 页 ,而 那些 不 常 被 执行 以 及 在 近期 内 不 可 能 被 执行 
的 页 , 则 存放 于 外 存 中 待 需 要 时 再 调 人 。 请 求 调 页 或 预 调 页 技术 是 基于 工作 区 的 局 部 性 原 
理 的 ,有 关 局 部 性 原理 也 将 在 本 节 的 后 面部 分 介绍 。 

由 于 使 用 了 请 求 调 页 或 预 调 页 技术 ,页 式 管理 时 内 存 页 面 的 分 配 与 回收 已 和 页 面 淘汰 
技术 及 缺 页 处 理 技术 结合 起 来 。 不 过 ,页 面 的 换 入 换 出 仍 是 必要 的 ,这 只 要 把 5. 3. 2 节 所 述 
的 交换 进程 稍 加 修改 就 能 用 于 页 面 的 交换 。 

分 页 管理 的 重点 在 于 页 划分 之 后 的 地 址 变换 以 及 页 面 的 调和 人 调 出 技术 。 


5.4.2 静态 页 式 管理 


静态 页 面 管 理 方法 是 在 作业 或 进程 开始 执行 之 前 ,把 该 作业 或 进程 的 程序 段 和 数据 全 
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部 装 入 内 存 的 各 个 页 面 中 ,并 通过 页 表 (page mapping table) 和 硬件 地 址 变换 机 构 实现 虚拟 
地 址 到 内 存 物理 地 址 的 地 址 映射 。 

1. 内 存 页 面 分 配 与 回收 

静态 分 页 管理 的 第 一 步 是 为 要 求 内 存 的 作业 或 进程 分 配 足够 的 页 面 。 系 统 依靠 存储 页 
面 表 、 请 求 表 以 及 页 表 来 完成 内 存 的 分 配 工作 。 首 先 来 介绍 这 3 个 表 。 

1) 页 表 

最 简单 的 页 表 由 页 号 与 页 面 号 组 成 ,如 图 5. 15 所 示 。 

页 表 在 内 存 中 占有 一 块 固定 的 存储 区 。 页 表 的 大 小 由 进程 或 作业 的 长 度 决定 。 例 如 ， 
对 于 一 个 每 页 长 1K, 大 小 为 20K 的 进程 来 说 ,如 果 一 个 内 存单 元 存放 一 个 页 表 项 , 则 只 要 
分 配给 该 页 表 20 个 存储 单元 即 可 。 显 然 ,页 式 管理 时 每 个 进程 至 少 拥 有 一 个 页 表 。 

2) 请 求 表 

请 求 表 用 来 确定 作业 或 进程 的 虚拟 空间 的 各 页 在 内 存 中 的 实际 对 应 位 置 。 为 了 完成 这 
个 任务 ,系统 必须 知道 每 个 作业 或 进程 的 页 表 起 始 地 址 和 长 度 , 以 进行 内 存 分 配 和 地 址 变 
换 。 另 外 ,请 求 表 中 还 应 包括 每 个 作业 或 进程 所 要 求 的 页 面 数 。 

整个 系统 需要 一 张 请 求 表 , 如 图 5. 16 所 示 。 


进程 号 请 求 页 面 数 页 表 始 址 页 表 长 度 状态 
| 20 1024 20 已 分 配 
页 号 | 页 面 号 34 1044 34 已 分 配 
3 18 1078 18 已 分 配 
1 21 : : 未 分 配 
图 5.15 基本 页 表示 例 图 5.16 请 求 表 示例 


3) 存储 页 面 表 

存储 页 面 表 也 是 整个 系统 一 张 ,存储 页 面 表 指 出 内 存 各 页 面 是 否 已 被 分 配 出 去 ,以 及 未 
分 配 页 面 的 总 数 。 存 储 页 面 表 也 有 两 种 构成 方法 ,一 种 是 在 内 存 中 划分 一 块 固定 区 域 , 每 个 
单元 的 每 个 比特 代表 一 个 页 面 。 如 果 该 页 面 已 被 分 配 , 则 对 应 比特 位 置 1 ,和 否则 置 0, 这 种 方 
法 称 为 位 示 图 法 ,如 图 5. 17 所 示 。 


19 18 17 16 15 4 3 2 1 0 
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图 5.17 位 示 图 


位 示 图 要 占据 一 部 分 内 存 容量 ,例如 ,一 个 划分 为 1024 个 页 面 的 内 存 ,如 果 内 存单 元 长 
20bit, 则 位 示 图 要 占据 1024/20 王 52 个 内 存单 元 。 
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存储 页 面 表 的 另 一 种 构成 办 法 是 采用 空闲 页 面 链 的 方法 。 在 空闲 页 面 链 中 , 队 首 页 面 
的 第 一 个 单元 和 第 二 个 单元 分 别 放 人 空闲 页 面 总 数 与 指向 下 一 个 空闲 页 面 的 指针 。 其 他 页 
面 的 第 一 个 单元 中 则 分 别 放 和 人 指向 下 一 个 页 面 的 指针 。 空 闲 页 面 链 的 方法 由 于 使 用 了 空闲 
页 面 本 身 的 单元 存放 指针 ,因此 不 占据 额外 的 内 存 空间 。 

2. 分 配 算法 

利用 上 述 3 个 表格 和 数据 结构 ,给 出 一 个 页 面 分 配 算法 。 

首先 ,请 求 表 给 出 进程 或 作业 要 求 的 页 面 数 。 然 后 ,由 存储 页 面 表 检查 是 否 有 足够 的 空 
闲 页 面 ,如 果 没 有 , 则 本 次 无 法 分 配 ;如 果 有 , 则 首先 分 配 设置 页 表 , 并 填写 请 求 表 中 的 相应 
表 项 后 , 按 一 定 的 查找 算法 搜索 出 所 要 求 的 空闲 页 面 , 并 将 对 应 的 页 面 号 填 人 页 表 中 。 
图 5. 18 给 出 了 上 述 页 面 分 配 算法 的 流程 图 。 

静态 页 式 管理 的 页 面 回收 方法 较为 简单 , 当 进 程 执行 完毕 时 ,拆除 对 应 的 页 表 , 并 把 页 
表 中 的 各 页 面 插 入 存储 页 面 表 即 可 。 

3. 地 址 变换 

静态 页 式 管理 的 另 一 个 关键 问题 是 地 址 变换 , 即 怎 样 由 页 号 和 页 内 相对 地 址 变换 到 内 
存 物 理 地 址 的 问题 。 另 外 ,由 于 静态 重 定位 可 以 使 CPU 直接 访问 物理 地 址 ,而 分 区 式 管理 
中 的 动态 重 定位 也 只 需 把 基 址 寄存 器 中 的 分 区 起 始 地 址 与 待 访问 指令 的 虚 地 址 相 加 即 可 得 
到 所 要 访问 的 物理 地 址 。 这 两 种 重 定位 法 都 不 需要 访问 内 存 就 可 得 到 待 执行 指令 所 要 访问 
的 物理 地 址 。 那 么 ,页 式 管 理 时 ,地 址 变换 的 速度 怎样 呢 ? 这 也 是 设计 地 址 变换 机 构 时 必须 
考虑 的 问题 之 一 。 

由 地 址 分 配方 式 知道 ,在 一 个 作业 或 进程 的 页 表 中 ,连续 的 页 号 对 应 于 不 连续 的 页 面 
号 。 例 如 , 设 一 个 3 页 长 的 进程 具有 页 号 0、1、2, 但 其 对 应 的 页 面 号 则 为 2、3、8, 如 图 5. 19 
所 示 。 设 每 个 页 面 长 度 为 I]K ,指令 LOAD 1,2500 的 虚 地 址 为 100, 怎 样 通过 图 5. 19 所 示 
的 页 表 来 找到 该 指令 所 对 应 的 物理 地 址 呢 ? 下 面 使 用 该 例子 说 明 地 址 变换 过 程 。 
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请 求 "个 页 面 


空闲 页 


2 个 空闲 


设置 页 表 ， 将 页 表 始 址 
和 页 表 长 度 置 入 请 求 表 
中 ， 置 状态 为 已 分 配 


| 页 号 | 页 面 号 
搜索 空闲 页 面 表 ， 分 配 
n 个 页 面 ， 并 将 页 面 号 0 2 
填 入 页 表 中 
1 3 
8 
图 5.18 页 面 分 配 算法 流 图 图 5. 19 ”页 号 与 页 面 号 
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首先 ,需要 有 一 个 装置 页 表 始 址 和 页 表 长 度 用 的 控制 寄存 器 。 系 统 把 所 调度 执行 的 进 
程 页 表 始 址 和 长 度 从 请 求 表 中 取出 置 入 控制 寄存 器 中 。 

然后 ,由 控制 寄存 器 的 页 表 始 址 可 以 找到 页 表 所 在 位 置 , 并 由 虚 地 址 100 可 知 ,指令 
LOAD 1,2500 在 第 0 页 的 第 100 单元 之 中 。 由 于 第 0 页 与 第 2 个 页 面相 对 应 ,因此 ,该 指 
令 在 内 存 中 的 地 址 为 2048 十 100 二 2148。 

当 CPU 执行 到 第 2148 单元 的 指令 时 ,CPU 要 从 有 效 地 址 2500 中 取 数 据 放 和 1 号 寄 
存 器 中 。 为 了 找 出 2500 对 应 的 实际 物理 地 址 ,地址 变换 机 构 首 先 将 2500 转换 为 页 号 与 页 
内 相对 地 址 组 成 的 地 址 形式 , 即 p= 二 2,w 二 452。 

由 页 表 可 知 ,第 2 页 所 对 应 的 页 面 号 等 于 8。 最 后 ,将 页 面 号 8 与 页 内 相对 地 址 w= 
452 相连 ,得 到 待 访问 的 物理 内 存 地 址 8644。 其 变换 过 程 如 图 5. 20 所 示 。 


控制 寄存 器 有 效 地 址 
页 表 长 度 | 页 表 始 址 2 452 
物理 地 址 
一 | 页 号 | 页 面 号 
0 2 8 452 
1 3 
2 8 HH 
2148 
LOAD 1, 2500 
8644 Data 
Tt 7 
内 存 
图 5.20 地址 变换 


上 述 地 址 变换 过 程 全 部 由 硬件 地 址 变换 机 构 自 动 完成 。 

另外 ,由 于 页 表 是 驻 留 在 内 存 的 某 个 固定 区 域 中 ,而 取 数据 或 指令 又 必须 经 过 页 表 变 换 
才能 得 到 实际 物理 地 址 。 因 此 , 取 一 个 数据 或 指令 至 少 要 访问 内 存 两 次 以 上 。 一 次 访问 页 
表 以 确定 所 取 数 据 或 指令 的 物理 地 址 , 另 一 次 是 根据 地 址 取 数 据 或 指令 。 这 上 比 通常 执行 指 
令 的 速度 慢 了 一 倍 。 有 什么 办 法 可 以 提高 查找 速度 吗 ? 一 个 最 直观 的 办 法 就 是 把 页 表 放 在 
寄存 器 中 而 不 是 内 存 中 ,但 由 于 寄存 器 价格 太 贵 ,这 样 做 是 不 可 取 的 。 另 一 种 办 法 是 在 地 址 
变换 机 构 中 加 入 一 个 高 速 联想 存储 器 ,构成 一 张 快 表 。 在 快 表 中 , 存 和 那些 当前 执行 进程 中 
最 常用 的 页 号 与 所 对 应 的 页 面 号 ,从 而 提高 查找 速度 。 

静态 页 式 管理 解决 了 分 区 管理 时 的 碎片 问题 。 但 是 ,由 于 静态 页 式 管理 要 求 进程 或 作 
业 在 执行 前 全 部 装 入 内 存 ,如 果 可 用 页 面 数 小 于 用 户 要 求 时 ,该 作业 或 进程 只 好 等 待 。 而 
且 ,作业 或 进程 的 大 小 仍 受 内 存 可 用 页 面 数 的 限制 。 这 些 问 题 将 在 动态 (请 求 ) 页 式 管理 中 
解决 。 


5.4.3 动态 页 式 管 理 


动态 页 式 管理 是 在 静态 页 式 管理 的 基础 上 发 展 起 来 的 。 它 分 为 请 求 页 式 管理 和 预 调 入 
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页 式 管 理 。 

请 求 页 式 管理 和 预 调 入 页 式 管理 在 作业 或 进程 开始 执行 之 前 ,都 不 把 作业 或 进程 的 程 
序 段 和 数据 段 一 次 性 地 全 部 装 入 内 存 , 而 只 装 入 被 认为 是 经 常 反复 执行 和 调用 的 工作 区 部 
分 。 其 他 部 分 则 在 执行 过 程 中 动态 装 入。 请 求 页 式 管 理 与 预 调和 人 页 式 管 理 的 主要 区 别 在 它 
们 的 调 入 方式 上 。 请 求 页 式 管理 的 调和 人 方式 是 , 当 需 要 执行 某 条 指令 而 又 发 现 它 不 在 内 存 
时 ,或 当 执行 某 条 指令 需要 访问 其 他 的 数据 或 指令 ,而 这 些 指令 和 数据 不 在 内 存 中 时 , 即 发 
生 缺 页 中 断 , 系 统 将 外 存 中 相应 的 页 面 调和 内存。 

预 调和 页 式 管 理 的 调和 人 方式 是 ,系统 对 那些 在 外 存 中 的 页 进行 调 入 顺序 计算 ,估计 出 这 
些 页 中 指令 和 数据 的 执行 和 被 访问 的 顺序 ,并 按 此 顺序 将 它们 顺 次 调 入 和 调 出 内 存 。 除 了 
在 调 人 方式 上 请 求 页 式 管理 和 预 调和 页 式 管理 有 些 区 别 之 外 ,在 其 他 方面 这 两 种 方式 基本 
相同 。 因 此 ,下 面 主要 介绍 请 求 页 式 管理 。 

请 求 页 式 管理 的 地 址 变换 过 程 与 静态 页 式 管 理 时 的 相同 ,也 是 通过 页 表 查 出 相应 的 页 
面 号 之 后 ,由 页 面 号 与 页 内 相对 地 址 相 加 而 得 到 实际 物理 地 址 。 

但 是 ,由 于 请 求 页 式 管理 只 让 进程 或 作业 的 部 分 程序 和 数据 驻 留 在 内 存 中 ,因此 ,在 执 
行 过 程 中 ,不 可 避免 地 会 出 现 某 些 虚 页 不 在 内 存 中 的 问题 。 怎 样 发 现 这 些 不 在 内 存 中 的 虚 
页 以 及 怎样 处 理 这 种 情况 ,是 请 求 页 式 管理 必须 解决 的 两 个 基本 问题 。 

第 一 个 问题 可 以 用 扩充 页 表 的 方法 解决 。 即 与 每 个 虚 页 号 相对 应 ,除了 页 面 号 之 外 ,再 
增设 该 页 是 否 在 内 存 的 中 断 位 以 及 该 页 在 外 存 中 的 副本 起 始 地 址 。 扩 充 后 的 页 表 如 图 5. 21 
所 示 。 

关于 虚 页 不 在 内 存 时 的 处 理 涉及 两 个 问题 。 第 一 ,采用 何 种 方式 把 所 缺 的 页 调 入 内 存 。 
第 二 ,如 果 内 存 中 没有 空闲 页 面 时 ,把 调 进来 的 页 放 在 什么 地 方 。 也 就 是 说 ,采用 什么 样 的 
策略 来 淘汰 已 占据 内 存 的 页 。 还 有 ,如 果 在 内 存 中 的 某 一 页 被 淘汰 , 且 该 页 曾 因 程 序 的 执行 
而 被 修改 , 则 显然 该 页 是 应 该 重新 写 到 外 存 上 加 以 保存 的 。 而 那些 未 被 访问 修改 的 页 ,因为 
外 存 已 保留 有 相同 的 副本 , 写 回 外 存 是 没有 必要 的 。 因 此 ,在 页 表 中 还 应 增加 一 项 以 记录 该 
页 是 否 曾 被 改变 。 增 加 改变 位 后 的 页 表 如 图 5. 22 所 示 。 


页 号 | 页 面 号 中 断 位 | 外 存 始 址 | 改变 位 


中 断 位 | 外 存 始 址 


wm 


页 号 | 页 面 
0 
1 
2 
3 


图 5.21 加 入 中 断 处 理 后 的 页 表 图 5.22 加 入 改变 位 后 的 页 表 


有 关 缺 页 的 调和 信和 存放 ,在 内 存 中 没有 空闲 页 面 时 ,实际 上 是 一 个 内 存 页 面 置换 算法 的 
问题 。 选 择 什么 样 的 置换 算法 ,将 直接 影响 到 内 存 利 用 率 和 系统 效率 。 事 实 上 ,如 果 置 换算 
法 选择 不 当 , 有 可 能 产生 刚 被 调 出 内 存 的 页 又 要 马上 被 调 回 内 存 , 调 回 内 存 不 久 又 马上 被 调 
出 内 存 , 如 此 反复 的 局 面 。 这 使 得 整个 系统 的 页 面 调 度 非常 频繁 ,以 致 大 部 分 时 间 都 花费 在 
内 存 和 外 存 之 间 的 来 回调 入 调 出 上 ,这 种 现象 被 称 为 抖动 (thrashing) 现 象 。 

有 关 拌 动 现象 的 讨论 ,将 在 5.4.4 节 中 介绍 。 
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动态 页 式 管理 的 流程 图 如 图 5. 23 所 示 。 
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图 5.23 动态 页 式 管理 流程 图 


在 图 5. 23 中 ,有 关 地 址 变换 部 分 是 由 硬件 自动 完成 的 。 当 硬件 变换 机 构 发 现 所 要 求 的 
页 不 在 内 存 时 ,产生 缺 页 中 断 信号 ,由 中 断 处 理 程序 做 出 相应 的 处 理 。 中 断 处 理 程 序 是 由 软 
件 实现 的 。 除 了 在 没有 空闲 页 面 时 要 按照 置换 算法 选择 出 被 淘汰 页 面 之 外 ,还 要 从 外 存 读 
入 所 需要 的 虚 页 。 这 个 过 程 要 启动 相应 的 外 存 并 涉及 文件 系统 。 因 此 ,请 求 页 式 管理 是 一 
个 十 分 复杂 的 处 理 过 程 , 内 存 利用 率 的 提高 是 以 牺牲 系统 开销 的 代价 换 来 的 。 

下 面 介绍 几 种 常用 的 置换 算法 。 


5.4.4 请 求 页 式 管 理 中 的 置换 算法 


置换 算法 在 内 存 中 没有 空闲 页 面 时 被 调用 , 它 的 目的 是 选 出 一 个 被 淘汰 的 页 面 。 如 果 
内 存 中 有 足够 的 空闲 页 面 存 放 所 调 人 的 页 , 则 不 必 使 用 置换 算法 。 把 内 存 和 外 存 统一 管理 
的 真正 目的 是 把 那些 被 访问 概率 非常 高 的 页 存放 在 内 存 中 。 因 此 ,置换 算法 应 该 置换 那些 
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被 访问 概率 最 低 的 页 ,将 它们 移出 内 存 。 比 较 常用 的 置换 算法 有 以 下 几 种 : 

1. 随机 淘汰 算法 

在 系统 设计 人 员 认 为 无 法 确定 哪些 页 被 访问 的 概率 较 低 时 ,随机 地 选择 某 个 用 户 的 页 
面 并 将 其 换 出 将 是 一 种 明智 的 做 法 。 

2. 轮转 法 (round robin) 和 先进 先 出 (FIFO) 算 法 

轮转 法 循环 换 出 内 存 可 用 区 内 一 个 可 以 被 换 出 的 页 ,无论 该 页 是 刚 被 换 进 或 已 换 进 内 
存 很 长 时 间 。 

FIFO 算法 总 是 选择 在 内 存 驻 留 时 间 最 长 的 一 页 将 其 淘汰 。FIFO 算法 认为 先 调 人 内 
存 的 页 不 再 被 访问 的 可 能 性 要 比 其 他 页 大 ,因而 选择 最 先 调和 人 内 存 的 页 换 出 。 实 现 FIFO 
算法 需要 把 各 个 已 分 配 页 面 按 分 配 时 间 顺 序 链接 起 来 ,组 成 FIFO 队列 ,并 设置 一 个 置换 指 
针 指 向 FIFO 队列 的 队 首 页 面 。 这 样 , 当 要 进行 置换 时 ,只 需 把 置换 指针 所 指 的 FIFO 队列 
前 头 的 页 顺 次 换 出 ,而 把 换 入 的 页 链接 在 FIFO 队 尾 即 可 。 

由 实验 和 测试 发 现 FIFO 算法 和 轮转 法 的 内 存 利 用 率 不 高 。 这 是 因为 ,这 两 种 算法 都 
是 基于 CPU 按 线性 顺序 访问 地 址 空间 的 这 个 假设 。 事 实 上 ,许多 时 候 ,CPU 不 是 按 线性 顺 
序 访 问 地 址 空间 的 ,例如 在 执行 循环 语句 时 。 因 此 ,那些 在 内 存 中 停留 时 间 最 长 的 页 往往 也 
是 经 常 被 访问 的 页 。 尽 管 这 些 页 变 “ 老 ”了 。 但 它们 被 访问 的 概率 仍然 很 高 。 

先进 先 出 算法 的 另 一 个 缺点 是 它 有 一 种 陷阱 现象 。 一 般 来 说 ,对 于 任 一 作业 或 进程 ,如 
果 给 它 分 配 的 内 存 页 面 数 越 接近 于 它 所 要 求 的 页 面 数 , 则 发 生 缺 页 的 次 数 会 越 少 。 在 极限 
情况 下 ,这 个 推论 是 成 立 的 。 因 为 如 果 给 一 个 进程 分 配 了 它 所 要 求 的 全 部 页 面 , 则 不 会 发 生 
缺 页 现象 。 但 是 ,使 用 FIFO 算法 时 ,在 未 给 进程 或 作业 分 配 足 它 所 要 求 的 页 面 数 时 ,有 时 
会 出 现 分 配 的 页 面 数 增多 , 缺 页 次 数 反而 增加 的 奇怪 现象 。 这 种 现象 称 为 Belady 现象 ,如 
图 5. 24 所 示 。 
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图 5.24 FIFO 算法 的 Belady 现象 


下 面 的 例子 可 以 用 来 说 明 FIFO 算法 的 正常 换 页 情况 和 Belady 现象 。 

设 进 程 P 共 有 8 页 , 且 已 在 内 存 中 分 配 有 3 个 页 面 ,程序 访问 内 存 的 顺序 (访问 串 ) 为 
7,0,1,2,0,3,0,4,2,3,0,3,2,1,2,0,1。 这 里 ,这 些 自然 数 代表 进程 P 所 建 的 程序 和 数据 
的 页 号 。 内 存 中 有 关 进 程 P 所 建 的 程序 和 数据 的 各 页 面 变 化 情况 如 图 5. 25 所 示 。 

由 图 5.25 可 以 看 出 ,进程 在 一 个 执行 过 程 中 ,实际 上 发 生 了 12 次 缺 页 。 如 果 设 缺 页 率 
为 缺 页 次 数 与 访问 串 的 访问 次 数 之 比 , 则 该 例 中 的 缺 页 率 为 12/17s*70.5%%。 

如 果 给 进程 P 分 配 4 个 页 面 , 则 在 其 执行 过 程 中 内 存 页 面 的 变化 情况 如 图 5. 26 所 示 。 
进程 P 在 拥有 4 个 内 存 页 面 时 , 共 发 生 9 次 缺 页 ,其 缺 页 率 为 9/17252.9%。 
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图 5.25 Belady 现象 示例 (1) 


以 上 是 使 用 FIFO 算法 正常 换 页 时 的 例子 。 下 面 我 们 来 看 看 另外 一 种 访问 串 时 的 情 
况 。 设 进程 P 可 分 为 5 页 ,访问 串 为 1,2,3,4,1,2,5,1,2,3,4,5。 当 进程 P 分 得 3 个 页 面 
时 ,执行 过 程 中 内 存 页 面 变化 如 图 5. 27 所 示 。 
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图 5.27 Belady 现象 示例 (3) 


由 图 5.27 可 知 ,进程 P 在 执行 过 程 中 共 缺 页 9 次 ,其 缺 页 率 为 9/12= 二 75%。 
但 是 ,如 果 为 进程 P 分配 4 个 内 存 页 面 ,是否 缺 页 率 会 变 小 呢 ? 进程 P 分 得 4 个 页 面 
时 ,执行 过 程 中 内 存 页 面 的 变化 情况 如 图 5. 28 所 示 。 
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图 5.28 Belady 现象 示例 (4) 


由 图 5. 28 可 知 , 当 进程 P 分 得 4 个 页 面 时 ,在 执行 过 程 中 的 缺 页 次 数 为 10 次 。 即 缺 页 
率 为 10/12<:83.3%%。 


先进 先 出 算法 产生 Belady 现象 的 原因 在 于 它 根 本 没有 考虑 程序 执行 的 动态 特征 。 
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3. 最 近 最 久未 使 用 (least recently used) 页 面 置换 算法 

该 算法 的 基本 思想 是 : 当 需 要 淘汰 某 一 页 时 ,选择 离 当 前 时 间 最 近 的 一 段 时 间 内 最 久 
没有 使 用 过 的 页 先 淘汰 。 该 算法 的 主要 出 发 点 是 ,如 果 某 页 被 访问 了 , 则 它 可 能 马上 还 要 被 
访问 。 或 者 反 过 来 说 ,如 果 某 页 很 长 时 间 未 被 访问 , 则 它 在 最 近 一 段 时 间 也 不 会 被 访问 。 

要 完全 实现 LRU 算法 是 一 件 十 分 困难 的 事情 。 因 为 要 找 出 最 近 最 久未 被 使 用 的 页 
面 ,就 必须 对 每 一 个 页 面 都 设置 有 关 的 访问 记录 项 ,而 且 每 一 次 访问 都 必须 更 新 这 些 记录 。 
这 显然 要 花费 巨大 的 系统 开销 。 因 此 ,在 实际 系统 中 往往 使 用 LRU 的 近似 算法 。 

比较 常用 的 近似 算法 有 以 下 两 种 : 

1) 最 不 经 常 使 用 (least frequently used,LFU) 页 面 淘汰 算法 

该 算法 在 需要 淘汰 某 一 页 时 ,首先 淘汰 到 当前 时 间 为 止 被 访问 次 数 最 少 的 那 一 页 。 这 
只 要 在 页 表 中 给 每 一 页 增设 一 个 访问 计数 器 即 可 实现 。 每 当 该 页 被 访问 时 ,访问 计数 器 加 
1, 而 发 生 一 次 缺 页 中 断 时 , 则 淘汰 计数 值 最 小 的 那 一 页 ,并 将 所 有 的 计数 器 清 零 。 

2) 最 近 没 有 使 用 (NUR) 页 面 淘汰 算法 

该 算法 在 需要 淘汰 某 一 页 时 ,从 那些 最 近 一 个 时 期 内 未 被 访问 的 页 中 任 选 一 页 淘汰 。 
只 要 在 页 表 中 增设 一 个 访问 位 即 可 实现 。 当 某 页 被 访问 时 ,访问 位 置 1; 和 否则 ,访问 位 置 0。 
系统 周期 性 地 对 所 有 引用 位 清 零 。 当 需 淘汰 一 页 时 ,从 那些 访问 位 为 零 的 页 中 选 一 页 进行 

4. 理想 型 淘汰 算法 (optimal replacement algorithm,OPT) 

该 算法 淘汰 在 访问 串 中 将 来 再 也 不 出 现 的 或 是 在 离 当 前 最 远 的 位 置 上 出 现 的 页 。 这 
样 ,淘汰 掉 该 页 将 不 会 造成 因 需 要 访问 该 页 又 立即 把 它 调 入 的 现象 。 遗 憾 的 是 ,这 种 算法 无 
法 实现 ,因为 它 要 求 必须 预先 知道 每 一 个 进程 的 访问 串 。 


5.4.5 存储 保护 


页 式 管理 可 以 为 内 存 提供 两 种 方式 的 保护 ,一 种 是 地 址 越界 保护 , 男 一 种 是 通过 页 表 控 
制 对 内 存 信息 的 存 取 操作 方式 以 提供 保护 。 

地 址 越界 保护 可 由 地 址 变换 机 构 中 的 控制 寄存 器 的 值 一 一 页 表 长 度 和 所 要 访问 的 虚 地 
址 相 比 较 来 完成 。 

存 取 控 制 保护 的 实现 则 是 在 页 表 中 增加 相应 的 保护 位 即 可 。 


5.4.6 页 式 管理 的 优 缺 点 


综 上 所 述 ,页 式 管理 具有 如 下 优点 : 

(1) 由 于 它 不 要 求 作业 或 进程 的 程序 段 和 数据 在 内 存 中 连续 存放 ,从 而 有 效 地 解决 了 
碎片 问题 。 

(2) 动态 页 式 管理 提供 了 内 存 和 外 存 统一 管理 的 虚 存 实现 方式 ,使 用 户 可 以 利用 的 存 
储 空间 大 大 增加 。 这 既 提 高 了 主 存 的 利用 率 , 又 有 利于 组 织 多 道 程序 执行 。 

其 主要 缺点 如 下 : 

(1) 要 求 有 相应 的 硬件 支持 。 例 如 地 址 变换 机 构 , 缺 页 中 断 的 产生 和 选择 淘汰 页 面 等 
都 要 求 有 相应 的 硬件 支持 。 这 增加 了 机 器 成 本 。 

(2) 增加 了 系统 开销 ,例如 缺 页 中 断 处 理 等 。 
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(3) 请 求 调 页 的 算法 如 选择 不 当 , 有 可 能 产生 抖动 现象 。 
(4) 虽然 消除 了 碎片 ,但 每 个 作业 或 进程 的 最 后 一 页 内 总 有 一 部 分 空间 得 不 到 利用 。 
如 果 页 面 较 大 , 则 这 一 部 分 的 损失 仍然 较 大 。 


5.5 段 式 与 段 页 式 管理 


5.5.1 段 式 管理 的 基本 思想 


分 区 式 管理 和 页 式 管理 时 的 进程 地 址 空间 结构 都 是 线性 的 ,这 要 求 对 源 程序 进行 编译 、 
链接 时 ,把 源 程序 中 的 主 程序 、 子 程序 和 数据 区 等 按 线性 空间 的 一 维 地 址 顺序 排列 起 来 。 这 
使 得 不 同 作业 或 进程 之 间 共 享 公用 子 程 序 和 数据 变 得 非常 困难 。 因 为 用 户 在 调用 公用 子 程 
序 或 数据 块 时 ,往往 采用 指定 程序 名 或 数据 块 的 方法 。 这 就 要 求 所 共享 的 信息 在 逻辑 上 是 
完整 的 。 而且, 对 于 不 同 的 用 户 进程 来 说 ,它们 访问 这 些 公 用 子 程 序 或 数据 块 的 权限 是 不 同 
的 。 因 此 ,如 果 系 统 不 能 把 用 户 给 定 的 程序 名 和 数据 块 名 与 这 些 被 共享 程序 和 数据 在 某 个 
进程 中 的 虚 页 对 应 起 来 , 则 不 可 能 共享 这 些 存放 在 内 存 页 面 中 的 程序 和 数据 。 男 外 ,由 于 在 
页 式 管理 时 ,一 个 页 面 中 可 能 装 有 两 个 不 同 子 程序 段 的 指令 代码 ,因此 ,通过 页 面 共享 来 达 
到 共享 一 个 逻辑 上 完整 的 子 程序 或 数据 块 是 不 可 能 的 。 

再 者 ,从 链接 的 角度 看 ,分 区 管理 和 页 式 管理 只 能 采用 静态 链接 。 一 个 大 的 进程 可 能 包 
含 数 百 个 甚至 上 千 个 程序 模块 。 对 它们 进行 链接 要 花费 大 量 的 CPU 时 间 , 而 实际 执行 时 
则 可 能 只 用 到 其 中 的 一 个 子 集 。 因 此 ,从 减少 CPU 开销 和 存储 空间 浪费 的 角度 来 看 ,静态 
链接 是 不 合适 的 。 

综 上 所 述 , 段 式 存储 管理 是 基于 为 用 户 提供 一 个 方便 灵活 的 程序 设计 环境 而 提出 来 的 。 
段 式 管理 的 基本 思想 是 : 把 程序 按 内 容 或 过 程 (函数 ) 关 系 分 成 段 , 每 段 有 自己 的 名 字 。 一 
个 用 户 作业 或 进程 所 包含 的 段 对 应 于 一 个 二 维 线性 虚拟 空间 ,也 就 是 一 个 二 维 虚拟 存储 器 。 
段 式 管理 程序 以 段 为 单位 分 配 内 存 , 然 后 通过 地 址 映射 机 构 把 段 式 虚拟 地 址 转换 成 实际 的 
内 存 物 理 地 址 。 和 页 式 管理 时 一 样 , 段 式 管理 也 采用 只 把 那些 经 常 访问 的 段 驻 留 内 存 , 而 把 
那些 在 将 来 一 段 时 间 内 不 被 访问 的 段 放 入 外 存 , 待 需要 时 自动 调 入 的 方法 实现 二 维 虚 拟 存 
储 器 。 


5.5.2 上 段 式 管理 的 实现 原理 


1. 段 式 虚 存 空间 

段 式 管理 把 一 个 进程 的 虚 地 址 空间 设计 成 二 维 结构 , 即 段 号 s 与 段 内 相对 地 址 w。 在 
页 式 管 理 中 ,被 划分 的 页 号 按 顺 序 编号 递增 排列 , 属 一 维 空间 ,而 段 式 管理 中 的 段 号 与 段 号 
之 间 无 顺序 关系 。 另 外 , 段 的 划分 也 不 像 页 的 划分 那样 具有 相同 的 页 长 , 段 的 长 度 是 不 固定 
的 。 每 个 段 定 义 一 组 逻辑 上 完整 的 程序 或 数据 。 例 如 ,一 个 进程 中 的 程序 和 数据 可 被 划分 
为 主 程序 段 . 子 程序 段 .数据 段 与 工作 区 段 。 

每 个 段 是 一 个 首 地 址 为 零 的 .连续 的 一 维 线性 空间 。 根 据 需 要 , 段 长 可 动态 增长 。 对 段 
式 虚 地 址 空间 的 访问 包括 两 个 部 分 : 段 名 和 段 内 地 址 。 例 如 : 


CALL [X] | <Y> 转向 段 名 为 x 的 子 程序 的 入 口 点 Y 
。 124 。 


LOAD 1, [A]16 将 段 名 为 A 的 数组 中 第 6 个 元 素 的 值 读 到 寄存 器 1 中 

STORE 1, [B] |<C> 寄存 器 1 的 内 容 存 人 段 名 为 B, 段 中 地 址 为 c 的 单元 中 

其 中 的 段 名 XX、A、B 及 入 口 名 YY 等 经 编译 和 链接 后 转换 成 机 器 内 部 可 以 识别 的 段 号 和 
段 内 单元 号 。 例 如 ,如 果 [X] 对 应 的 段 号 为 3, 二 Y 放 对 应 的 段 内 单元 号 为 120 的 话 , CALL 
LXj| 二 Y 二 可 被 编译 成 CALL 31120。 

2. 段 式 管理 的 内 存 分 配 与 释放 

段 式 管理 中 以 段 为 单位 分 配 内 存 , 每 段 分 配 一 个 连续 的 内 存 区 。 由 于 各 段 长 度 不 等 ,所 
以 这 些 存储 区 的 大 小 不 一 。 而 且 , 同 一 进程 所 包含 的 各 段 之 间 不 要 求 连续 。 

段 式 管理 的 内 存 分 配 与 释放 在 作业 或 进程 的 执行 过 程 中 动态 进行 。 首 先 , 段 式 管 理 程 
序 为 一 个 进入 内 存 准 备 执行 的 进程 或 作业 分 配 部 分 内 存 , 以 作为 该 进程 的 工作 区 和 放置 即 
将 执行 的 程序 段 。 随 着 进程 的 执行 ,进程 根据 需要 随时 申请 调 人 新 段 和 释放 老 段 。 进 程 对 
内 存 区 的 申请 和 释放 可 分 为 两 种 情况 。 一 种 是 当 进 程 要 求 调 入 某 一 段 时 ,内 存 中 有 足够 的 
空闲 区 满足 该 段 的 内 存 要 求 ; 另 一 种 是 内 存 中 没有 足够 的 空闲 区 满足 该 段 的 内 存 要 求 。 

对 于 第 一 种 情况 ,系统 要 用 相应 的 表格 或 数据 结构 来 管理 内 存 空闲 区 ,以 便 对 用 户 进程 
或 作业 的 有 关 程 序 段 进行 内 存 分 配 和 回收 。 事 实 上 ,可 以 采用 和 动态 分 区 式 管理 相同 的 空 
闲 区 管理 方法 。 即 把 内 存 各 空闲 区 按 物 理 地 址 从 低 到 高 排列 或 按 空 闲 区 大 小 从 小 到 大 或 从 
大 到 小 排列 。 与 这 几 种 空闲 区 自由 链 相 对 应 ,分 区 式 管理 时 所 用 的 几 种 分 配 算 法 一 一 最 先 
适应 法 .最 佳 适 应 法 和 最 坏 适 应 法 都 可 用 来 进行 空闲 区 分 配 。 当 然 , 分 区 式 管理 时 用 到 的 内 
存 回收 方法 也 可 以 在 段 式 管理 中 使 用 。 

另 一 种 内 存 空闲 区 的 分 配 与 回收 方法 是 在 内 存 中 没有 足够 的 空闲 区 满足 调 人 段 的 内 存 
要 求 时 使 用 的 。 这 时 , 段 式 管理 程序 根据 给 定 的 置换 算法 淘汰 内 存 中 在 今后 一 段 时 间 内 不 
再 被 CPU 访问 的 段 , 也 就 是 淘汰 那些 访问 概率 最 低 的 段 。 

动态 页 式 管理 中 的 几 种 常用 的 淘汰 算法 都 可 以 用 来 作为 段 式 管理 时 的 淘汰 算法 。 例 如 
FIFO 置换 算法 、LRU 算法 及 其 近似 算法 等 。 但 是 ,与 页 式 管理 时 每 页 具有 相同 的 长 度 时 不 
一 样 ,需要 调 人 的 某 段 长 度 可 能 大 于 被 淘汰 的 一 段 程序 或 数据 的 长 度 。 这 样 ,仅仅 淘汰 一 段 
可 能 仍然 满足 不 了 需要 调 入 段 的 内 存 要 求 。 此 时 ,就 应 再 淘汰 另外 的 段 ,直到 满足 需 调 入 段 
的 内 存 要 求 时 为 止 。 

事实 上 ,一 次 调 入 时 所 需 淘汰 的 段 数 与 段 的 大 小 有 关 。 如 果 一 个 作业 或 进程 的 段 数 较 
多 , 且 段 长 之 间 的 差别 较 大 , 则 有 可 能 出 现 调 入 某 个 大 段 时 需 淘汰 好 几 个 小 段 的 情况 。 不 
过 ,在 段 式 管理 时 ,任何 一 个 段 的 段 长 都 不 允许 超过 内 存 可 用 区 长 度 , 否 则 将 会 造成 内 存 分 
配 出 错 。 

除了 初始 分 配 之 外 , 段 的 动态 分 配 是 在 CPU 所 要 访问 的 指令 和 数据 不 在 内 存 时 产生 
缺 段 中 断 的 情况 下 发 生 的 。 因 此 , 段 的 淘汰 或 置换 算法 实际 上 是 缺 段 中 断 处 理 过 程 的 一 
部 分 。 

缺 段 中 断 处 理 过 程 如 图 5. 29 所 示 。 图 中 ,X 代表 所 缺 段 段 号 。 该 处 理 程序 是 在 CPU 
访问 执行 时 ,地 址 变换 机 构 发 现 该 段 不 在 内 存 , 而 由 硬件 发 出 缺 段 中 断 信 号 后 被 调用 的 。 

3. 段 式 管理 的 地 址 变换 

由 于 段 式 管理 只 存放 部 分 用 户 信息 副本 在 内 存 ,而 大 部 分 信息 在 外 存 中 ,这 必然 引起 
CPU 访问 内 存 时 发 生 所 要 访问 的 段 不 在 内 存 的 现象 。 那么 ,CPU 如 何 感知 到 所 要 访问 的 
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需 调 入 新 段 X 


内 存 中 存在 不 小 于 X 
段 长 的 空闲 区 吗 ? 


内 存 中 所 有 空闲 区 
总 和 小 于 X 段 长 吗 ? 


按 FIFO 算法 、LRU 算法 合并 空闲 区 
或 LFU 算法 反复 淘汰 老 段 ，| | 以 形成 长 度 
以 形成 一 个 长 度 不 小 于 X ”| | 不 小 于 X 段 长 
段 长 的 空闲 区 的 空闲 区 
| 为 X 段 分 配 内 存 空闲 区 


将 X 段 调 入 内 存 
并 改写 段 表 


图 5.29 缺 段 中 断 处 理 过 程 


段 不 在 内 存 而 启动 中 断 处 理 程序 呢 ? 

还 有 , 段 式 虚拟 地 址 属于 一 个 二 维 的 虚拟 空间 。 一 个 二 维 空间 的 虚拟 地 址 怎样 变换 为 
一 个 一 维 的 线性 物理 地 址 呢 ? 这 些 都 由 段 式 地 址 变换 机 构 解决 。 

1) 段 表 (segment mapping table) 

和 页 式 管 理 方案 类 似 , 段 式 管理 程序 在 进行 初始 内 存 分 配 之 前 ,首先 根据 用 户 要 求 的 内 
存 大 小 为 一 个 作业 或 进程 建立 一 个 段 表 ,以 实现 动态 地 址 变换 和 和 缺 段 中 断 处 理 及 存储 保护 
等 。 与 页 式 管 理 时 一 样 , 段 式 管理 也 是 通过 段 表 来 进行 内 存 管理 的 。 考 虑 了 缺 段 处 理 和 段 
式 访问 控制 保护 后 的 段 表 如 图 5. 30 所 示 。 

图 中 “ 段 号 ”与 用 户 指定 的 段 名 一 一 对 应 ,“ 始 址 ”和 “长 度 ” 分 别 表示 该 段 在 内 存 或 外 存 
的 物理 地 址 与 实际 长 度 。“ 存 取 方 式 ” 是 用 来 对 该 段 进行 存 取 保护 的 。 只 有 处 理 机 状态 字 中 
的 存 取 控制 位 与 自 表 中 的 存 取 方 式 一 致 时 才能 访问 该 段 。“ 内 外 ”是 指出 该 段 现 在 存储 于 外 
存 还 是 内 存 中 。 如 果 该 栏 指出 所 访问 段 在 外 存 的 话 , 则 发 生 中 断 。 而 “访问 位 ? 则 是 根据 淘 
汰 算法 的 需要 而 设 的 ,这 里 假定 淘汰 算法 淘汰 那些 访问 位 未 被 改变 过 的 段 (NUR 算法 ) 。 

2) 动态 地 址 变换 

一 般 在 内 存 中 给 出 一 块 固定 的 区 域 放 置 段 表 。 当 某 进 程 开 始 执行 时 ,管理 程序 首先 把 
该 进程 的 段 表 始 址 放 人 段 表 地 址 寄存 器 。 通 过 访问 段 表 寄 存 器 ,管理 程序 得 到 该 进程 的 段 
表 始 址 ,从 而 可 开始 访问 段 表 。 然 后 ,由 虚 地 址 中 的 段 号 s 为 索引 , 查 段 表 。 若 该 段 在 内 存 ， 
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长 度 | 存 取 方 式 | 内 外 访问 位 


图 5.30 段 表 


则 判断 其 存 取 控 制 方式 是 否 有 错 。 如 果 存 取 控 制 方式 正确 , 则 从 段 表 相应 表 项 中 查 出 该 段 
在 内 存 的 起 始 地 址 ,并 将 其 和 段 内 相对 地 址 w 相 加 ,从 而 得 到 实际 内 存 地址 。 

如 果 该 段 不 在 内 存 , 则 产生 缺 段 中 断 , 将 CPU 控制 权 交 给 内 存 分 配 程序 。 内 存 分 配 程 
序 首先 检查 空闲 区 链 , 以 找到 足够 长 度 的 空闲 区 来 装 入 所 需要 的 段 。 如 果 内 存 中 的 可 用 空 
闲 区 总 数 小 于 所 要 求 的 段 长 时 , 则 检查 段 表 中 的 访问 位 ,以 淘汰 那些 访问 概率 低 的 段 并 将 需 
要 的 段 调 入 。 段 式 地 址 变换 过 程 如 图 5. 31 所 示 。 


段 表 地 址 寄存 器 
段 表 始 址 
段 表 
段 号 | 始 址 | 长 度 | 存 取 方 式 内 外 | 访问 人 
中 | | | | 
1 | Sat | | i 内 3400 一 3520 
| | | | 
| | | | 
虚拟 地 址 
1 [120 
段 号 段 内 地 址 丙 在 


图 5.31 段 式 地 址 变换 过 程 


与 页 式 管理 时 相同 , 段 式 管理 时 的 地 址 变换 过 程 也 必须 经 过 二 次 以 上 的 内 存 访问 。 即 
首先 访问 段 表 以 计算 得 到 待 访问 指令 或 数据 的 物理 地 址 ,然后 才 是 对 物理 地 址 进行 取 数 据 
或 存 数据 操作 。 为 了 提高 访问 速度 ,页 式 地 址 变换 时 使 用 的 高 速 联想 寄存 器 的 方法 也 可 以 
用 在 段 式 地 址 变换 中 。 即 高 速 联想 寄存 器 中 存放 那些 经 常 访问 的 段 号 所 对 应 的 段 表 项 , 且 
高 速 联 想 寄 存 器 中 的 段 表 和 内 存 的 段 表 可 同时 查找 。 如 果 在 高 速 联想 寄存 器 中 找到 了 所 需 
要 的 段 , 则 可 以 大 大 加 快 地 址 变换 速度 。 

4. 段 的 共享 与 保护 

段 式 存储 管理 可 以 方便 地 实现 内 存 信息 共享 和 进行 有 效 的 内 存 保护 。 这 是 因为 段 是 按 
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逻辑 意义 来 划分 的 ,可 以 按 段 名 访问 的 缘故 。 

1) 段 的 共享 

在 多 道 环境 下 ,常常 有 许多 子 程序 和 应 用 程序 是 被 多 个 用 户 所 使 用 的 。 特 别 是 在 多 窗 
口 系统 .支持 工具 等 广泛 流行 的 今天 ,被 共享 的 程序 和 数据 的 个 数 和 体积 都 在 急剧 增加 ,有 
时 往往 超过 用 户 程序 长 度 的 许多 倍 。 这 种 情况 下 ,如果 每 个 用 户 进 程 或 作业 都 在 内 存 保留 
它们 的 共享 程序 和 数据 的 副本 ,就 会 极 大 地 浪费 内 存 空 间 。 最 好 的 办 法 是 内 存 中 只 保留 一 
个 副本 , 供 多 个 用 户 使 用 , 称 为 共享 。 图 5. 32 给 出 了 一 个 段 式 系统 中 共享 的 例子 。 
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图 5.32 段 式 系统 中 共享 内 存 副本 


如 图 5. 32 所 示 ,如 果 用 户 进 程 或 作业 需要 共享 内 存 中 的 某 段 程序 或 数据 ,只 要 用 户 使 
用 相同 的 段 名 ,就 可 在 新 的 段 表 中 填 人 已 存在 于 内 存 之 中 的 段 的 起 始 地 址 ,并 置 以 适当 的 读 
写 控制 权 ,就 可 做 到 共享 一 个 逻辑 上 完整 的 内 存 段 信息 。 

另外 ,在 多 道 环境 下 ,由 于 进程 的 并 发 执行 ,一 段 程序 为 多 个 进程 共享 时 ,有 可 能 出 现 多 
次 同时 重复 执行 该 段 程序 的 情况 ( 即 某 个 进程 在 未 执行 完 该 段 程序 之 前 ,其 他 并 发 进程 又 已 
开始 执行 该 段 程序 ) 。 这 就 要 求 在 执行 过 程 中 ,该 段 程序 的 指令 和 数据 不 能 被 修改 。 还 有 ， 
与 一 个 进程 中 的 其 他 程序 段 一 样 ,共享 段 有 时 也 要 被 换 出 内 存 。 这 时 ,就 要 在 段 表 中 设立 相 
应 的 共享 位 来 判别 该 段 是 否 正 被 某 个 进程 调用 。 显 然 一 个 正在 被 某 个 进程 使 用 或 即将 被 某 
个 进程 使 用 的 共享 段 是 不 应 该 调 出 内 存 的 。 

2) 段 的 保护 

与 页 式 管理 时 相同 , 段 式 管理 的 保护 主要 有 两 种 ,一 种 是 地 址 越界 保护 法 , 另 一 种 是 存 
取 方 式 控制 保护 法 。 关 于 存 取 方 式 控制 保护 已 在 前 面 介 绍 ,这 里 不 再 重复 。 而 地 址 越界 保 
护 则 是 利用 段 表 中 的 段 长 项 与 虚拟 地 址 中 的 段 内 相对 地 址 比较 进行 的 。 若 段 内 相对 地 址 大 
于 段 长 ,系统 就 会 产生 保护 中 断 。 不 过 ,在 允许 段 动态 增长 的 系统 中 , 段 内 相对 地 址 大 于 段 
长 是 允许 的 。 为 此 , 段 表 中 设置 相应 的 增补 位 以 指示 该 段 是 否 允 许 动态 增长 。 


5.5.3 ”上 段 式 管理 的 优 缺 点 


与 页 式 管理 和 分 区 式 管 理 比 较 , 段 式 管理 的 长 处 与 短处 可 分 别 总 结 如 下 。 
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(1) 和 动态 页 式 管理 一 样 , 段 式 管理 也 提供 了 内 外 存 统一 管理 的 虚 存 实现 。 与 页 式 管 
理 不 同 的 是 , 段 式 虚 存 每 次 交换 的 是 一 段 有 意义 的 信息 ,而 不 是 像 页 式 虚 存 那样 只 交换 固定 
大 小 的 页 ,从 而 需要 多 次 缺 页 中 断 才 能 把 所 需 信 息 完整 地 调 人 内 存 。 

(2) 在 段 式 管理 中 , 段 长 可 根据 需要 动态 增长 。 这 对 那些 需要 不 断 增加 或 吸收 新 数据 
的 段 来 说 ,将 是 非常 有 好 处 的 。 

(3) 便于 对 具有 完整 逻辑 功能 的 信息 段 进行 共享 。 

(4) 便于 实现 动态 链接 。 由 于 段 式 管理 是 按 信息 的 逻辑 意义 来 划分 段 ,每 段 对 应 一 个 
相应 的 程序 模块 。 因 此 ,可 用 段 名 加 上 段 和 人口 地 址 等 方法 在 执行 过 程 中 调 人 相应 的 段 进 行 
动态 链接 。 当 然 , 段 的 动态 链接 需要 一 定 的 硬件 支持 ,例如 ,需要 链接 寄存 器 存放 被 链接 段 
的 出 口 等 。 

尽管 段 式 管理 有 较 多 的 优点 ,但 是 , 段 式 管理 比 其 他 几 种 方式 要 求 有 更 多 的 硬件 支持 。 
这 就 提高 了 机 器 成 本 。 另 外 ,由 于 段 式 管理 在 内 存 空闲 区 管理 方式 上 与 分 区 式 管理 相同 ,在 
碎片 问题 以 及 为 了 消除 碎片 所 进行 的 合并 等 问题 上 较 分 页 式 管理 要 差 。 再 者 ,允许 段 的 动 
态 增 长 也 会 给 系统 管理 带 来 一 定 的 难度 和 开销 。 

段 式 管理 的 另 一 个 缺点 就 是 每 个 段 的 长 度 受 内 存 可 用 区 大 小 的 限制 。 

和 页 式 管理 一 样 , 段 式 管理 系统 在 选择 淘汰 算法 时 也 必须 十 分 慎重 ,否则 也 有 可 能 产生 
抖动 现象 。 


5.5.4 段 页 式 管理 的 基本 思想 


以 上 几 种 存储 管理 方式 各 有 特长 。 段 式 管理 为 用 户 提供 了 一 个 二 维 的 虚 地 址 空间 , 反 
映 了 程序 的 迎 辑 结构 ,有 利于 段 的 动态 增长 .共享 和 内 存 保护 等 ,这 大 大 地 方便 了 用 户 。 而 
分 页 系统 则 有 效 地 克服 了 碎片 ,提高 了 存储 器 的 利用 率 。 从 存储 管理 的 目的 来 讲 , 主 要 是 方 
便 用 户 的 程序 设计 和 提高 内 存 的 利用 率 。 那 么 ,把 段 式 管理 和 页 式 管理 结合 起 来 让 其 互相 
取长补短 不 是 更 好 吗 ? 于 是 , 段 页 式 管 理 方式 便 被 提 了 出 来 。 

不 过 ,由 于 段 式 管理 与 页 式 管理 都 需要 较 大 的 系统 开销 ,可 以 预计 到 段 页 式 管理 的 开销 
会 更 大 。 因 此 , 段 页 式 管理 方式 一 般 只 用 在 大 型 机 系统 中 。 近 年 来 由 于 硬件 发 展 很 快 , 段 页 
式 管理 的 开销 在 工作 站 等 机 型 上 已 变 得 可 以 容忍 了 。 例 如 UNIX System V 就 采用 了 分 区 
加 请 求 页 式 的 内 存 管理 技术 。 


5.5.5 上 段 页 式 管理 的 实现 原理 


1. 虚 地 址 的 构成 

段 页 式 管理 时 ,一 个 进程 仍然 拥有 一 个 自己 的 二 维 地 址 空间 ,这 与 段 式 管理 时 相同 。 首 
先 ,一 个 进程 中 所 包含 的 具有 独立 逻辑 功能 的 程序 或 数据 仍 被 划分 为 段 ,并 有 各 自 的 段 号 
s。 这 反映 和 继承 了 段 式 管理 的 特征 。 其 次 ,对 于 段 s 中 的 程序 或 数据 , 则 按照 一 定 的 大 小 
将 其 划分 为 不 同 的 页 。 和 页 式 系统 一 样 , 最 后 不 足 一 页 的 部 分 仍 占 一 页 。 这 反映 了 段 页 式 
管理 中 的 页 式 特征 。 从 而 , 段 页 式 管理 时 的 进程 的 虚拟 地 址 空间 中 的 虚拟 地 址 由 3 部 分 组 
成 , 即 段 号 s、 页 号 p 和 页 内 相对 地 址 d, 如 下 所 示 : 


Ww 
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对 于 这 个 由 3 部 分 组 成 的 虚拟 地 址 来 说 ,程序 员 可 见 的 仍 是 段 号 s 和 段 内 相对 地 址 w。 
p 和 d 是 由 地 址 变换 机 构 把 w 的 高 几 位 解释 成 页 号 p, 以 及 把 剩 下 的 低位 解释 为 页 内 地 址 d 
而 得 到 的 。 

由 于 虚拟 空间 的 最 小 单位 是 页 而 不 是 段 ,从 而 内 存 可 用 区 也 就 被 划分 成 为 若干 个 大 小 
相等 的 页 面 , 且 每 段 所 拥有 的 程序 和 数据 在 内 存 中 可 以 分 开 存 放 。 分 段 的 大 小 也 不 再 受 内 
存 可 用 区 的 限制 。 

2. 段 表 和 页 表 

为 了 实现 段 页 式 管理 ,系统 必须 为 每 个 作业 或 进程 建立 一 张 段 表 ,管理 内 存 分 配 与 释 
放 、 缺 段 处 理 、 存 储 保护 和 地 址 变换 等 。 另 外 ,由 于 一 个 段 又 被 划分 成 了 若干 页 ,每 个 段 又 必 
须 建立 一 张 页 表 , 把 段 中 的 虚 页 变换 成 内 存 中 的 实际 页 面 。 显 然 ,与 页 式 管理 时 相同 ,页 表 
中 也 要 有 实现 缺 页 中 断 处 理 和 页 面 保 护 等 功能 的 表 项 。 另 外 ,由 于 在 段 页 式 管理 中 ,页 表 不 
再 是 属于 进程 而 是 属于 某 个 段 , 因 此 , 段 表 中 应 有 专项 指出 该 段 所 对 应 页 表 的 页 表 始 址 和 页 
表 长 度 。 段 页 式 管理 中 段 表 、 页 表 以 及 内 存 的 关系 如 图 5. 33 所 示 , 图 中 各 表 中 的 “其 他 ” 栏 
可 参考 段 式 或 页 式 管 理 中 的 相应 栏目 。 


段 表 地 址 寄存 器 
段 表 长 度 | 起 始 地 址 页 号 [其 他 | 页面 
= 1 12 | 
段 号 | 其 他 | 页 表 长 度 | 起 始 地 址 B44 2 19 
0| | 5 1024 3 21 
| = | 1029 4 8 
2| | 。， 1036 5 10 
段 表 第 0 段 页 表 AN 
页 号 | 其 他 | 页 面 
|- 一- | 


第 2 段 页 表 内 存 
图 5.33 段 页 式 管理 中 段 表 、 页 表 与 内 存 的 关系 


3. 动态 地 址 变换 过 程 

在 一 般 使 用 段 页 式 存储 管理 的 计算 机 系统 中 ,都 在 内 存 中 辟 出 一 块 固定 的 区 域 存 放 进 
程 的 段 表 和 页 表 。 因 此 ,在 段 页 式 管理 系统 中 ,要 对 内 存 中 的 指令 或 数据 进行 一 次 存 取 的 
话 ,至少 需 要 访问 3 次 以 上 的 内 存 。 第 一 次 是 由 段 表 地 址 寄存 器 得 到 段 表 始 址 去 访问 段 表 ， 
由 此 取出 对 应 段 的 页 表 地 址 。 第 二 次 则 是 访问 页 表 得 到 所 要 访问 的 物理 地 址 。 只 有 在 访问 
了 段 表 和 页 表 之 后 ,第 三 次 才能 访问 真正 需要 访问 的 物理 单元 。 显 然 ,这 将 使 CPU 的 执行 
指令 速度 大 大 降低 。 

为 了 提高 地 址 转换 速度 ,设置 高 速 联 想 寄存 器 就 显得 比 段 式 管理 或 页 式 管理 时 更 加 需 
要 。 在 高 速 联想 寄存 器 中 ,存放 当前 最 常用 的 段 号 s、 页 号 p 和 对 应 的 内 存 页 面 与 其 他 控制 
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用 栏目 。 当 要 访问 内 存 空 间 某 一 单元 时 ,可 在 通过 段 表 、 页 表 进 行内 存 地 址 查找 的 同时 , 根 
据 高 速 联 想 寄存 器 查找 其 段 号 和 页 号 。 如 果 所 要 访问 的 段 或 页 在 高 速 联想 寄存 器 中 , 则 系 
统 不 再 访问 内 存 中 的 段 表 、 页 表 而 直接 把 高 速 联想 寄存 器 中 的 值 与 页 内 相对 地 址 d 拼接 起 
来 得 到 物理 地 址 。 经 验 表明 ,一 个 在 高 速 联想 寄存 器 中 装 有 1/10 左右 的 段 号 、 页 号 及 页 面 
的 段 页 式 管理 系统 ,可 以 通过 高 速 联 想 寄存 器 找到 90 为 以 上 的 所 要 访问 的 内 存 地 址 。 

段 页 式 管理 的 地 址 变换 机 构 如 图 5. 34 所 示 。 


快速 联想 寄存 器 


段 表 地 址 寄存 器 虚拟 地 址 
段 表 长 度 | 起 始 地 址 s|p|d 


Ss | P | p” 
| | 
段 表 s 段 的 页 表 


s| 二 本 页 而 G4) 了 | 物理 地 址 


图 5.34 段 页 式 管理 的 地 址 变换 


以 上 简单 地 介绍 了 段 页 式 管理 中 地 址 变换 的 基本 原理 。 有 关 段 页 式 管理 中 的 存储 保护 
和 共享 以 及 缺 段 或 缺 页 中 断 处 理 等 ,可 参照 段 式 管理 或 页 式 管 理 中 的 方法 解决 。 

总 之 ,因为 段 页 式 管理 是 段 式 管理 和 页 式 管理 方案 结合 而 成 的 ,所 以 具有 它们 二 者 的 优 
点 。 但 反 过 来 说 ,由 于 管理 软件 的 增加 ,复杂 性 和 开销 也 就 随 之 增加 了 。 另 外 ,需要 的 硬件 
以 及 占用 的 内 存 也 有 所 增加 。 更 重要 的 是 ,如 果 不 采 用 联想 寄存 器 的 方式 提高 CPU 的 访 
内 速度 ,将 会 使 得 执行 速度 大 大 下 降 。 


5.6 局 部 性 原理 和 抖动 问题 


动态 页 式 管理 、 段 式 管理 以 及 段 页 式 管理 都 提供 了 一 种 将 内 存 和 外 存 统一 管理 ,内 存 中 
只 存放 那些 经 常 被 调用 和 访问 的 程序 段 和 数据 ,而 进程 或 作业 的 其 他 部 分 则 存放 于 外 存 中 
待 需要 时 再 调 入 内 存 的 虚拟 存储 器 的 实现 方法 。 然 而 ,由 于 上 述 实 现 方 法 实质 上 要 在 内 存 
和 外 存 之 间 交 换 信息 ,因此 ,就 要 不 断 地 启动 外 部 设备 以 及 相应 的 处 理 过 程 。 一 般 来 说 , 计 
算 机 系统 的 外 部 存储 器 与 内 存 不 同 ,它们 具有 较 大 的 容量 而 访问 速度 并 不 高 。 而 且 ,为 了 进 
行 数据 的 读 写 而 涉及 的 一 系列 处 理 程 序 ( 例 如 设备 管理 程序 .中 断 处 理 程序 等 ) 也 要 耗 去 大 
量 的 时 间 。 如 果 内 存 和 外 存 之 间 数 据 交 换 频繁 ,也 就 是 说 ,一 个 进程 在 执行 过 程 中 缺 页 率 或 
缺 段 率 过 高 ,势必 会 造成 对 输入 /输出 设备 的 巨大 压力 和 使 得 机 器 的 主要 开销 大 多 用 在 反复 
调 入 调 出 数据 和 程序 段 上 ,从 而 无 法 完成 用 户 所 要 求 的 工作 。 因 此 , 段 式 、 页 式 以 及 段 页 式 
虚 存 实现 方法 都 要 求 在 内 存 中 存放 一 个 不 小 于 最 低 限度 的 程序 段 或 数据 ,而 且 它 们 必须 是 
那些 正在 被 调用 ,或 那些 即将 被 调用 的 部 分 。 这 就 使 得 内 外 存 之 间 的 数据 交换 减少 到 最 低 
限度 。 

幸好 ,由 模拟 实验 知道 ,在 几乎 所 有 的 程序 的 执行 中 ,在 一 段 时 间 内 ,CPU 总 是 集中 地 
访问 程序 中 的 某 一 个 部 分 而 不 是 随机 地 对 程序 所 有 部 分 具有 平均 访问 概率 ,人 们 把 这 种 现 
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象 称 为 局 部 性 原理 (principle of locality) 。 与 CPU 访问 该 局 部 内 的 程序 和 数据 的 次 数 相 
比 , 该 局 部 段 的 移动 速率 是 相当 慢 的 。 这 就 使 得 前 面 所 讨论 的 页 式 管理 、 段 式 管理 以 及 段 页 
式 管理 所 实现 的 虚 存 系统 成 为 可 能 。 

但 是 ,如 果 不 能 正确 地 将 那些 系统 所 需要 的 局 部 段 放 入 内 存 , 则 系统 的 效率 显然 会 大 大 
降低 ,甚至 系统 无 法 有 效 地 工作 。 

试验 表明 ,任何 程序 在 局 部 性 放 入 时 ,都 有 一 个 临界 值 要 求 。 当 内 存 分 配 小 于 这 个 临界 
值 时 ,内 存 和 外 存 之 间 的 交换 频率 将 会 急剧 增加 ,而 内 存 分 配 大 于 这 个 临界 值 时 ,再 增加 内 
存 分 配 也 不 能 显著 减少 交换 次 数 。 这 个 内 存 要 求 的 临界 值 被 称 为 工作 集 。 图 5. 35 说 明 这 


变换 次 数 


FE 二 二 一 - 
工作 保 ”临界 值 进程 内 存量 


图 5.35 内 存 与 交换 次 数 的 关系 


一 个 进程 执行 过 程 中 缺 页 (missing page) 的 发 生 有 两 种 可 能 。 一 种 是 并 发 进程 所 要 求 
的 工作 集 总 和 大 于 内 存 可 提供 的 可 用 区 。 这 时 ,系统 将 无 法 正常 工作 ,因为 缺乏 足够 的 空间 
装 人 所 需要 的 程序 和 数据 。 另 一 种 可 能 性 是 ,虽然 存储 管理 程序 为 每 个 并 发 进程 分 配 了 足 
够 的 工作 集 , 但 系统 无 法 在 开始 执行 前 选择 适当 的 程序 段 和 数据 进入 内 存 。 这 种 情况 下 ,只 
能 依靠 执行 过 程 中 , 当 CPU 发 现 所 要 访问 的 指令 或 数据 不 在 内 存 时 ,由 硬件 中 断后 转 入 中 
断 处 理 程序 ,将 所 需要 的 程序 段 和 数据 调 人 。 这 是 一 种 很 自然 的 处 理 方 法 。 

当 给 进程 分 配 的 内 存 小 于 所 要 求 的 工作 集 时 ,由 于 内 存 与 外 存 之 间 交 换 频 繁 ,访问 外 存 
时 间 和 输入 /输出 处 理 时 间 大 大 增加 ,反而 造成 CPU 因 等 待 数据 空转 ,使 得 整个 系统 性 能 
大 大 下 降 ,这 就 造成 了 系统 抖动 。 

可 以 利用 统计 模型 进一步 分 析 工 作 集 与 抖动 之 间 的 关系 。 

设 r 为 CPU 在 内 存 中 存 取 一 个 内 存单 元 的 时 间 ,t 为 从 外 存 中 读 出 一 页 数据 所 需 时 间 ， 
p(s) 为 CPU 访问 内 存 时 ,所 访问 的 页 正好 不 在 内 存 的 概率 ,这 里 ; 是 当前 进程 在 内 存 中 的 
工作 集 。 显 然 ,在 虚 存 情况 下 存 取 一 个 内 存单 元 的 平均 时 间 可 描述 为 

T=rip(s)xt 
由 程序 模拟 可 知 ， 
ps) = ae™ 
这 里 ;0<a 过 1< bde “< 
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另外 ,假定 内 存 中 各 并 发 进程 具有 相同 的 统计 特性 ,而 且 对 于 一 个 并 发 进程 来 说 ,只 有 
发 生 缺 页 时 才 变 成 等 待 状态 。 这 是 为 了 简化 讨论 而 忽略 了 外 部 设备 和 进程 通信 功能 的 
存在 。 

由 于 访问 外 存 一 个 页 面 的 速度 为 +, 且 缺 页 发 生 的 概率 为 p(s), 则 在 处 理 机 访问 一 个 内 
存单 元 的 时 间 r 内 ,平均 每 秒 引 起 的 内 外 存 之 间 页 传送 率 为 p(s)/r。 也 就 是 每 /p(s) 秒 需 
要 从 外 存 向 内 存 传送 一 页 。 从 而 ,对 于 一 个 在 虚 存 范围 内 执行 的 进程 , 它 可 以 处 于 以 下 3 种 
可 能 的 状态 之 中 : 

(LY Er Bs 

C2Y 7/ Ds) 

(3) t=r/p(s) 

对 于 第 (1) 种 情况 ,由 于 页 传送 速度 大 于 访问 外 存 页 面 的 速度 ,因此 ,进程 在 执行 过 程 中 
发 生 缺 页 的 次 数 较 少 ,并 不 经 常 从 外 存 调 页 。 

但 是 ,在 第 (2) 种 情况 时 ,由 于 内 外 存 之 间 的 页 面 传送 速度 已 经 小 于 访问 外 存 页 面 速度 ， 
因此 ,进程 在 执行 过 程 中 发 生 缺 页 的 次 数 已 经 多 到 外 存 供不应求 的 地 步 。 事 实 上 ,这 时 的 系 
统 已 处 于 抖动 状态 。 

第 (3) 种 情况 是 一 种 较 理 想 的 情况 , 即 进程 在 执行 过 程 中 所 需要 的 页 数 正好 等 于 从 外 存 
可 以 调 入 的 页 数 。 此 时 该 进程 在 内 存 中 占有 最 佳 工作 集 。 

根据 以 上 讨论 可 知 ,一 个 进程 在 内 存 中 占有 最 佳 工作 集 的 条 件 是 

p(s)=r/t 
这 里 ,是 CPU 访问 内 存单 元 所 需 平均 时 间 ,t 是 访问 外 存 一 个 页 面 所 需 平均 时 间 。 
因为 p(s) 可 表示 为 
p(s) = ae 
从 而 有 
s= (1/b)ln(at/r) 
即 , 与 内 存 存 取 速 度 r 相 比 , 若 外 存 传送 速度 越 慢 ,所 需 工 作 集 就 越 大 。 

当然 ,上 面 的 讨论 是 在 总 结 了 许多 近似 的 情况 下 得 出 的 结论 。 事 实 上 ,由 于 各 进程 所 包 
含 的 程序 段 多 少 以 及 选用 的 淘汰 算法 等 不 一 样 ,工作 集 的 选择 也 不 一 样 。 一 般 来 说 ,选择 工 
作 集 有 静态 和 动态 两 种 方法 ,这 里 不 再 进一步 介绍 。 

另外 ,由 以 上 讨论 ,可 以 找 出 解决 抖动 问题 的 几 种 关键 办 法 。 

抖动 只 有 在 上 /ps) 时 才 会 发 生 。 而 p(s) 等 于 ae“, 是 一 个 与 工作 集 s、 参 数 a 和 7 
有 关 的 概率 值 ,是 可 以 改变 的 。 对 于 给 定 的 系统 来 说 ,t 和 7 则 是 很 难 改变 的 数字 。 显 然 , 解 
决 抖动 问题 最 关键 的 办 法 是 将 p(s) 减 少 到 使 1 二 =r/p(s)。 这 只 需要 采取 以 下 两 种 办 法 
之 一 : 

(1) 增加 s, 也 就 是 扩大 工作 集 ; 

(2) 改变 参数 a 和 0, 也 就 是 选择 不 同 的 淘汰 算法 以 解决 抖动 问题 。 

在 物理 系统 中 ,为 了 防止 抖动 的 产生 ,在 进行 淘汰 或 置换 时 ,一 般 总 是 把 缺 页 进程 锁 住 ， 
不 让 其 换 出 ,而 调 入 的 页 或 段 总 是 占据 那些 暂时 得 不 到 执行 的 进程 所 占有 的 内 存 区 域 ,从 而 
扩大 缺 页 进程 的 工作 集 。UNIX System V 中 就 是 采用 的 这 种 方法 。 
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本 章 介绍 了 各 种 常用 的 内 存 管理 方法 ,它们 是 分 区 式 管 理 、 页 式 管理 、 段 式 管理 和 段 页 
式 管理 。 内 存 管理 的 核心 问题 是 如 何 解决 内 存 和 外 存 的 统一 ,以 及 它们 之 间 的 数据 交换 问 
题 。 内 存 和 外 存 的 统一 管理 使 得 内 存 的 利用 率 得 到 提高 ,用 户 程序 不 再 受 内 存 可 用 区 大 小 
的 限制 。 与 此 相关 联 ,内 存 管理 要 解决 内 存 扩 充 、 内 存 的 分 配 与 释放 、 虚 拟 地 址 到 内 存 物 理 
地 址 的 变换 、 内 存 保 护 与 共享 .内 外 存 之 间 数 据 交换 的 控制 等 问题 。 

表 5.1 系统 地 对 几 种 存储 管理 方法 所 提供 的 功能 和 所 需 硬 件 支持 作 了 比较 。 


表 5.1 各 种 存储 方法 比较 


方法 | 单 - 分 区 式 页 式 
功 能 连续 区 | 固定 分 区 | 可 变 分 区 | 静态 | 动态 人 下 
适用 环境 “| 单 首 多 道 多 道 多 道 多 道 
虚拟 裤 间 “| 一 维 一 维 一 维 二 维 二 证 
重 定位 方式 | 静态 静态 。 | 动态 ”| 动态 动态 动态 
租 态 或 动态 分 机 动态 分 配 L 
_、 | 静态 分 配 连 | 静态 或 动态 分 配 连 | 前 检 或 动态 分 配 | 去 态 分 配 以 段 为 单 | 动态 分 配 以 
分 配方 式 | 区 以 页 为 单位 的 非 | 全 鸭 们 全 区 页 为 单位 的 
加 连续 区 起 全 非 连续 区 
| 执行 完成 执行 完 | 淘 沐 与 执 | 。，，，，.。。| 淘 尖 与 执 
释放 可 和 完成 后 | 后 全部 上 分 区 释放 成 后 释 | 行 完成 局 汪 挫 个 完 成 行 完成 后 
放 放 释放 Ga 释放 
越界 保护 或 | ps 越界 保护 与 控 | 越界 保护 与 控 | 越界 保护 与 
保护 | 没有 越界 保护 与 保护 键 | 制 权 保护 制 权 保 护 控制 权 保 护 
| 外 存 .内 
有 欧 盖 与 交换 | 。， 存 统 一 | 外 存 . 内 存 统 一 | 外 存 \ 向 
内 存 扩充 | 拷 术 入 六 与 交换 技术 。 | 交换 | 管理 的 | 管理 的 庶 丰 统一 管理 
的 虚 存 
虚 存 
共享 “| 不 能 不 能 较 难 方便 方便 
保护 用 本 鬼 初 具 未 昌 直 本 换 要 机 | 段 式 地 址 变 
遇 保护 用 | 保护 用 “| 寄存 器 “| 地 址 变换 机 构 | 段 式 地 址 变换 机 构 ， 换 机 构 -保护 
硬件 支持 多 器 | 中 断 机 构 保护 与 中 断 , 动 态 四, 保 
过 存 器 。 | 寄存 器 | 加 重 定 | 亿 扩 与 中 断 , 动 
他 机 篇 | 保护 机 构 连接 机 构 人 


存储 管理 的 主要 功能 是 什么 ? 


L 
2 什么 是 虚拟 存储 器 ? 其 特点 是 什么 ? 

3 ”实现 地 址 重 定位 的 方法 有 哪 几 类 ? 形式 化 地 描述 动态 重 定位 过 程 。 
4 常用 的 内 存 信息 保护 方法 有 哪 几 种 ? 它们 各 自 的 特点 是 什么 ? 

5 如 果 把 DOS 的 执行 模式 改 为 保护 模式 ,起码 应 作 怎 样 的 修改 ? 
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动态 分 区 式 管理 的 常用 内 存 分 配 算法 有 哪 几 种 ? 比较 它们 各 自 的 优 缺 点 。 

5.2 节 讨 论 的 分 区 式 管理 可 以 实现 虚 存 吗 ?” 如 果 不 能 , 需 怎样 修改 ? 试 设计 一 个 分 区 
式 管理 实现 虚 存 的 程序 流程 图 。 如 果 能 , 试 说 明理 由 。 

什么 是 覆盖 ?什么 是 交换 ? 覆盖 和 交换 的 区 别 是 什么 ? 

什么 是 页 式 管理 ? 静态 页 式 管理 可 以 实现 虚 存 吗 ? 

什么 是 请 求 页 式 管 理 ? 试 设计 和 描述 一 个 请 求 页 式 管理 时 的 内 存 页 面 分 配 和 回收 算 
法 (包括 缺 页 处 理 部 分 ) 。 

请 求 页 式 管理 中 有 哪 几 种 常用 的 页 面 置 换算 法 ? 试 比 较 它 们 的 优 缺 点 。 

什么 是 Belady 现象 ? 试 找 出 一 个 Belady 现象 的 例子 。 

描述 一 个 包括 页 面 分 配 与 回收 页面 置 换 和 存储 保护 的 请 求 页 式 存储 管理 系统 。 
什么 是 段 式 管理 ? 它 与 页 式 管理 有 何 区 别 ? 

段 式 管理 可 以 实现 虚 存 吗 ? 如 果 可 以 , 简 述 实现 方法 。 

为 什么 要 提出 段 页 式 管理 ? 它 与 段 式 管理 及 页 式 管理 有 何 区 别 ? 

为 什么 说 段 页 式 管理 时 的 虚 地 址 仍 是 二 维 的 ? 

段 页 式 管理 的 主要 缺点 是 什么 ? 有 什么 改进 办 法 ? 

什么 是 局 部 性 原理 ? 什么 是 拌 动 ? 你 有 什么 办 法 减少 系统 的 抖动 现象 ? 
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第 6 章 进程 与 存储 管理 示例 


本 章 以 Linux 2.6 内 核 版 本 为 例 , 介 绍 Linux 的 进程 和 存储 管理 方法 。 


6.1 Linux 进程 和 存储 管理 简介 


Linux 系统 的 核心 部 分 从 整体 上 可 以 分 为 两 大 部 分 , 即 “ 静 ”的 文件 系统 和 “ 动 ”的 进程 
控制 系统 。 文 件 系统 主要 用 来 存放 ,管理 那些 暂时 不 被 处 理 机 执行 的 程序 和 数据 , 它 为 程序 
和 数据 文件 分 配 存储 空间 ,控制 文件 存 取 和 为 用 户 检索 信息 。 而 进程 控制 系统 则 负责 为 将 
要 执行 的 程序 和 数据 文件 分 配 内 存 空 间 , 并 负责 进程 调度 ,控制 并 发 进程 的 执行 速度 ,分 配 
必要 的 资源 ,以 及 负责 进程 通信 和 内 存 管理 等 。 

Linux 的 进程 控制 系统 与 文件 系统 之 间 通 过 数据 结构 和 函数 调用 来 互相 作用 。Linux 
的 文件 系统 以 及 文件 系统 与 进程 控制 系统 的 接口 部 分 将 在 第 10 章 中 讲述 。 这 里 先 介绍 
Linux 的 进程 控制 系统 部 分 。 

Linux 系统 把 一 个 程序 看 作 是 一 个 可 执行 文件 ,而 把 一 个 进程 看 作 是 程序 的 执行 或 执 
行 中 的 程序 实例 。 但 是 ,从 静态 的 观点 看 .CPU 把 进程 解释 为 由 一 组 机 器 指令 .数据 和 堆栈 
结构 组 成 的 集合 及 其 上 下 文 。 由 于 调度 并 不 一 定 是 在 每 个 进程 执行 完毕 时 发 生 , 因 此 ,系统 
内 可 以 同时 有 多 个 进程 在 执行 。 而 且 , 若 干 个 进程 可 以 同时 调用 同一 个 程序 。 

和 其 他 所 有 操作 系统 一 样 ,Linux 操作 系统 只 有 在 其 内 核 装 入 内 存 后 才能 开始 运行 。 

为 了 使 操作 系统 内 核能 在 每 次 开机 时 顺利 地 装 入 内 存 , 用 户 必 须 事 先 把 Linux 操作 系 
统 的 执行 代码 以 文件 方式 存储 在 计算 机 硬盘 设备 中 ,并 对 计算 机 系统 中 的 相应 资源 ,例如 引 
导 程 序 .交换 区 等 进行 初始 化 。 这 一 过 程 被 称 为 操作 系统 的 安装 过 程 。Linux 的 各 种 发 布 
版 本 都 有 自己 的 安装 程序 。 用 户 只 要 按照 安装 程序 的 提示 和 说 明 一 般 都 能 顺利 地 进行 系统 
安装 。 因 此 ,本 章 的 进程 运行 和 存储 管理 都 是 假定 在 一 个 已 完全 安装 好 的 操作 系统 基础 上 
进行 的 。 

在 一 个 已 安装 好 Linux 系统 的 计算 机 中 ,启动 电源 意味 着 系统 引导 程序 开始 系统 自 举 ， 
将 保存 在 外 存 硬盘 中 的 操作 系统 核心 加 载 到 内 存 , 然 后 进行 Linux 核心 的 初始 化 。 这 一 过 
程 是 一 个 设置 和 初始 化 各 种 数据 结构 与 表格 、 初 始 化 Linux 核心 的 各 个 子 系统 的 过 程 。 从 
进程 创建 的 角度 来 看 ,这 一 过 程 首先 建立 了 Linux 系统 中 唯一 一 个 静态 建立 的 进程 (在 
Linux 系统 中 把 该 进程 称 为 0* 进程 ,或 idle 进程 ), 之 后 建立 了 控制 终端 进程 及 运行 Shell 
进程 (用 户 交 互 进程 ) 的 init 进程 (有 时 也 称 其 为 1* 进程 )。 系 统 在 建立 了 Shell 进程 之 后 ， 
将 出 现 相应 的 提示 符 ,等 待 用 户 输 入 命令 来 执行 和 处 理 用 户 应 用 程序 。 

Linux 系统 在 初始 过 程 中 的 运行 如 图 6. 1 所 示 。 在 图 6. 1 中, 当 系统 创建 了 init 进程 
之 后 ,init 进程 将 会 调用 相应 的 终端 管理 进程 ,为 Linux 系统 的 不 同 终端 创建 相应 的 终端 管 
理 进程 和 和 Shell 进程 ,从 而 使 每 个 终端 上 的 用 户 都 可 以 在 Shell 的 管理 下 交互 使 用 Linux 

.136 。 


Shell 程序 将 为 用 户 提供 解释 执行 用 户 命令 的 交互 工具 。 随 着 用 户 命 令 , 例 如 cp 等 的 
输入 ,系统 将 建立 一 个 执行 该 命令 的 用 户 进程 。Shell 进程 则 会 进入 等 待 队 列 , 以 便 用 户 进 
程 执 行 。 在 用 户 进程 执行 结束 后 ,Shell 进程 又 恢复 执行 ,显示 提示 符 并 等 待 用 户 的 下 一 条 
命令 输入 。Linux 系统 的 所 有 进程 都 是 在 上 述 执行 过 程 中 产生 和 消亡 。 

由 图 6.1 可 以 看 到 ,终端 管理 进程 与 Shell 进程 是 init 进程 的 子 进程 ,而 其 他 的 用 户 进 
程 则 是 由 Shell 进程 创建 的 。 所 以 在 Linux 系统 中 ,除了 0* 进程 以 外 的 所 有 进程 都 是 由 
init 进程 衍生 出 来 的 ,从 而 人 们 也 称 init 进程 是 所 有 用 户 进程 的 祖先 。 


(GD (Linux 内 核 加 载 到 内 存 ) 
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图 6.1 Linux 系统 中 各 进程 的 关系 


Linux 操作 系统 的 0* 进程 在 核心 态 下 运行 ,而 init 进程 以 及 由 init 进程 衍生 的 其 他 进 
程 都 可 在 用 户 态 和 核心 态 两 种 执行 模式 下 执行 。 下 面 先 介绍 用 户 态 和 核心 态 。 

为 了 在 操作 系统 和 用 户 进程 之 间 进行 隔离 ,处 理 器 通常 提供 两 种 不 同 权限 的 执行 模式 ， 
核心 态 或 用 户 态 。 对 于 Intel 80x86 处 理 器 ,实际 上 提供 了 4 个 不 同 权限 的 执行 模式 ,但 是 
Linux 系统 主要 使 用 其 中 两 种 模式 ,所 以 不 失 普 遍 性 ,下 面 只 描述 为 两 种 模式 : 核心 态 和 用 
户 态 。 

两 种 执行 状态 之 间 的 主要 区 别 是 : 用 户 态 下 的 进程 能 存 取 它们 自己 的 指令 与 数据 ,但 
不 能 存 取 核心 指令 和 数据 ;而 核心 态 下 的 进程 能 存 取 核心 和 用 户 地 址 。 另 外 某 些 机 器 的 指 
令 是 特权 指令 (例如 输入 输出 指令 ) ,在 用 户 态 下 执行 会 引起 错误 ,只 能 在 核心 态 下 执行 。 操 
作 系 统 运行 在 核心 态 ,用 户 进程 通常 运行 在 用 户 态 ,只 有 当 用 户 进程 需要 请 求 操作 系统 的 服 
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务 时 , 才 通 过 系统 调用 切换 到 核心 态 ,操作 系统 完成 服务 后 再 次 将 用 户 进 程 切 换 回 用 户 态 。 
这 样 就 达到 了 在 操作 系统 和 用 户 进程 之 间 进 行 安 全 隔离 的 目的 。 

在 不 同 的 执行 模式 下 执行 时 ,同一 进程 使 用 不 同 的 堆栈 ,分 别称 为 核心 态 堆 栈 和 用 户 态 
堆栈 。 在 进程 切换 到 不 同 的 执行 模式 的 时 候 , 由 Linux 操作 系统 负责 为 进程 切换 到 相应 的 
堆栈 。 

Linux 系统 中 进程 通过 请 求 操作 系统 服务 进入 核心 态 的 机 制 称 为 系统 调用 。 具 体 的 实 
现 和 硬件 平台 的 体系 结构 相关 ,例如 在 80x86 系统 中 ,用 户 进程 通过 int 0x80 指令 请 求 系统 
调用 ,系统 调用 完成 后 通过 iret 指令 返回 到 用 户 态 。 它 们 之 间 的 关系 如 图 6.2 所 示 。 


Linux 用 户 进 程 


i 


核心 态 二 一 用 户 态 


iret 中 断 返回 指令 
图 6.2 Linux 进程 的 核心 态 与 用 户 态 之 间 的 转换 


上 面 说 过 0# 进程 是 只 在 核心 态 下 执行 的 进程 。 在 Linux 中 这 样 的 进程 称 为 核心 线程 
(kernel thread) 。 核 心 线程 除了 0# 进程 外 还 有 kblockd .ksoftirqdd 和 kswapd 等 ,它们 通常 
用 于 处 理 一 些 周期 性 的 事务 。 它 们 的 代码 在 核心 态 运 行 ,所 以 和 核心 拥有 相同 的 权限 。 和 
核心 使 用 同样 的 地 址 空间 ,所 以 没有 用 户 空 间 上 下 文 , 因 而 核心 线程 的 调度 开销 也 比较 小 。 

Linux 的 进程 控制 系统 在 逻辑 上 由 4 个 模块 组 成 : 与 文件 系统 的 接口 部 分 ;进程 本 身 的 
控制 部 分 ,包括 进程 的 创建 .进程 调度 和 进程 的 撤销 等 ;进程 间 控 制 部 分 ,包括 进程 间 的 互 
斥 .同步 和 通信 等 ;以 及 存储 管理 部 分 。 

调度 模块 的 作用 是 分 配 CPU。 显 然 ,在 进行 资源 分 配 特别 是 CPU 分 配 时 要 按照 一 种 
既 公 平 合理 又 有 很 高 效率 的 分 配 原则 。 在 Linux 系统 中 ,这 个 调度 原则 就 是 按照 进程 的 优 
先 级 ,每 次 调度 具有 最 高 优先 级 的 进程 去 占有 处 理 机 。 每 一 个 进程 ,从 它 被 创建 的 那 一 时 刻 
起 ,就 具有 了 一 个 随时 间 动 态 变 化 的 优先 级 。 在 Linux 中 ,调度 过 程 schedule() 和 时 钟 中 断 
都 会 修改 这 个 动态 的 优先 级 。 

Linux 中 引起 进程 调度 的 情况 有 下 面 几 种 : 

(1) 当前 执行 进程 申请 系统 资源 未 得 到 满足 ,从 而 自己 调用 sleep 过 程 , 放 弃 处 理 机 而 
进入 睡眠 状态 。 

(2) 为 了 与 其 他 并 发 进程 保持 同步 调用 了 wait 过 程 等 ,从 而 主动 放弃 了 处 理 机 而 进入 
睡眠 状态 。 

(3) 当 某 个 进程 被 唤醒 ,并 发 现 它 的 优先 级 高 于 当前 进程 的 优先 级 时 ,以 及 当前 进程 的 
时 间 片 用 完 时 ,系统 设置 一 个 名 叫 need_resched 的 调度 标志 ,但 是 ,系统 并 不 在 need_ 
resched 标志 刚 被 设置 时 就 开始 调度 ,而 要 等 到 系统 在 核心 态 下 的 程序 执行 完毕 ,由 核心 态 
转 入 用 户 态 时 ,也 就 是 在 中 断 陷入 总 控 处 理 程序 结束 之 前 的 瞬间 ,检查 need_resched 标志 
并 进行 调度 。 

(4) 当前 进程 调用 exit, 自 我 终止 时 。 

有 关 进 程控 制 和 调度 ,将 在 6.3 节 和 6.4 节 中 做 更 进一步 的 说 明 。 
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进程 通信 是 Linux 的 一 个 重要 组 成 部 分 。 进 程 通信 既 包 括 用 来 控制 各 并 发 进程 执行 速 
度 和 资源 共享 与 竞争 的 低级 通信 ,也 包括 进程 之 间 大 量 传递 信息 的 高 级 通信 。 

Linux 系统 在 核心 态 下 执行 时 ,系统 进程 可 以 使 用 下 列 同步 机 制 : 信号 量 、 自 旋 锁 、 关 
闭 中 断 和 使 用 原子 操作 等 。 用 户 进程 不 能 使 用 这 些 核心 态 的 同步 方法 、 用 户 进 程 之 间 要 实 
现 同步 通信 有 两 种 办 法 。 一 种 办 法 是 利用 系统 核心 提供 的 软 中 断 信 号 进行 通信 。Linux 为 
用 户 使 用 软 中 断 通信 提供 了 相应 的 系统 调用 。 另 一 种 办 法 是 调用 系统 调用 wait 或 sleep 使 
得 当前 执行 进程 进入 等 待 状态 ,直到 所 等 待 事件 发 生 时 由 核心 唤醒 或 睡眠 到 一 定时 间 后 自 
动 唤醒 。 用 户 进程 之 间 实 现 同步 的 高 级 办 法 是 信号 量 机 制 , 其 概念 和 原理 与 用 户 态 的 
UNIX System V 的 IPC 机 制 信号 量 一 样 。 

System V 中 的 IPC(Inter-Process Communication) 模 块 为 进程 间 的 大 量 信 息 传送 提供 
了 众多 的 系统 调用 。 

除了 上 述 通 信 手 段 之 外 ,Linux 还 提供 了 称 为 管道 (pipe) 和 命名 管道 (fifo) 的 信息 传送 
手段 。 它 以 文件 的 方式 ,实现 同一 主机 内 的 进程 之 间 批 量 数据 的 先进 先 出 方式 的 无 格式 字 
符 流传 送 。6. 5 节 中 将 较为 系统 地 介绍 Linux 的 进程 通信 。 

存储 管理 模块 控制 存储 分 配 。 任 何 一 个 待 执 行进 程 ,如 果 不 能 在 内 存 中 占据 必需 的 容 
量 ,就 不 能 执行 。 换 名 话说 ,CPU 绝对 不 会 执行 一 个 全 部 内 容 都 在 外 存 的 进程 。 然 而 ,内 存 
是 一 种 有 限 而 又 昂贵 的 资源 , 它 不 可 能 容纳 系统 中 全 部 活动 进程 。 存 储 管 理 系统 必须 决定 
把 哪 一 个 进程 的 哪 一 部 分 留 在 内 存 中 ,而 把 哪 一 部 分 放 在 外 存 。 也 就 是 说 ,存储 管理 部 分 管 
理 进程 在 内 存 和 外 存 之 间 的 信息 转移 ,以 便 所 有 进程 都 得 到 公平 执行 的 机 会 。6.6 节 中 将 
介绍 Linux 的 存储 管理 策略 一 一 请 求 调 页 。 

下 面 先 介绍 Linux 系统 的 进程 结构 。 


6.2 Linux 进程 结构 


6. 1 节 简 单 地 介绍 了 进程 与 存储 管理 的 一 些 高 层次 特性 。 本 节 进 一 步 介绍 Linux 进程 
的 静态 构成 ,定义 进程 上 下 文 及 其 状态 转换 等 。 


6.2.1 进程 的 概念 


在 Linux 系统 中 ,进程 被 赋予 了 下 述 特定 的 含义 和 特性 : 

(1) 一 个 进程 是 对 一 个 程序 的 执行 。 

(2) 一 个 进程 的 存在 意味 着 存在 一 个 task_struct 结构 , 它 包 含 着 相应 的 进程 控制 
信息 。 

(3) 一 个 进程 可 以 生成 或 消灭 其 子 进程 

(4) 一 个 进程 是 获得 和 释放 各 种 系统 资源 的 基本 单位 。 

上 述 第 (1) 点 是 反映 进程 动态 特性 的 ,而 第 (2) 点 又 反映 了 进程 的 静态 特性 ,第 (3) 点 与 
第 (4) 点 反映 了 Linux 系统 的 进程 之 间 的 关系 以 及 Linux 没有 作业 概念 的 特性 。 由 第 3 章 
可 知 ,一 个 进程 的 静态 描述 是 由 3 部 分 组 成 的 , 即 进程 状态 控制 块 ( 栈 段 ) ,进程 的 程序 文本 
(正文 ) 段 以 及 进程 的 数据 段 。 在 第 3 章 中 ,把 这 3 部 分 统称 为 进程 上 下 文 ,而 进程 的 动态 特 
性 则 定义 为 在 进程 上 下 文中 的 执行 。 
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下 面 介 绍 Linux 的 进程 控制 块 。 

Linux 的 task_struct 结构 相当 于 第 3 章 中 介绍 的 进程 控制 块 (PCB)。 与 UNIX 将 进程 
控制 块 分 割 为 长 驻 内 存 的 proc 和 可 交换 到 外 存 的 user 两 个 结构 不 同 ,Linux 只 使 用 task_ 
struct 这 样 一 个 独立 的 数据 结构 来 表示 进程 控制 块 。task_struct 是 一 个 相当 庞大 的 数据 结 
构 ,下面 只 讨论 其 中 重要 的 部 分 : 

(1) 标识 进程 的 状态 用 的 状态 位 。Linux 共有 6 种 基本 状态 。 有 关 这 些 状态 的 转换 和 
条 件 ,将 在 6. 2.4 节 介 绍 。 

(2) 进程 标识 号 (PID) ,用 来 唯一 地 标识 一 个 进程 。 

(3) 描述 进程 家 族 关系 、 组 成 员 关 系 的 一 些 指针 ,用 来 说 明 进程 相互 间 的 关系 。 

(4) 若干 用 户 标识 号 (ID) ,包括 用 户 ID(UID) .组 ID(GID) 等 。 这 些 用户 标 识 号 指出 该 
进程 属于 哪 一 组 用 户 ,进而 表明 了 该 进程 具有 何 种 权限 ,例如 可 以 访问 哪些 文件 。 

(5) 调度 参数 ,包括 优先 数 .调度 策略 .进程 所 处 的 就 绪 队 列 和 时 间 片 等 。 

(6) 软 中 断 信号 项 ,记录 和 软 中 断 信 号 相关 的 信息 

(7) 中 断 及 软 中 断 处 理 的 有 关 参 数 ， 依靠 这 些 参 数 , 进程 对 所 收 到 的 软 中 断 信 号 作出 不 
同 的 反应 。 

(8) 各 种 计时 项 ,给 出 进程 执行 时 间 和 系统 资源 的 利用 情况 。 这 些 信息 用 来 为 进程 记 
账 、. 计 算 调 度 优 先 权 以 及 发 送 计时 信和 号 等 。 

(9) 进程 地 址 空间 和 内 存 关 系 有 关 的 信息 ,这 是 一 个 mm_struct 类 型 的 成 员 , 它 描述 了 
进程 线性 区 域 .进程 数据 段 .正文 段 . 堆 段 起 始 位 置 .长 度 和 进程 页 表 指 针 。 

(10) 与 文件 系统 有 关 的 若干 项 ,这 是 一 个 fs_struct 类 型 的 成 员 。 该 结构 描述 了 进程 的 
当前 目录 和 当前 根 、 进 程 的 文件 系统 环境 .文件 设置 许可 权 方 式 以 及 字段 的 屏蔽 模式 等 。 

(11) 用 户 文件 描述 符 表 ,记录 该 进程 已 打开 的 文件 。 

(12) 进程 消亡 时 的 返回 值 和 终止 信号 , 父 进程 通过 检查 这 些 参数 来 了 解 进程 的 运行 
状况 。 

(13) 与 上 下 文 切换 ,现场 保护 有 关 的 各 项 ,它们 保存 各 种 通用 寄存 器 和 程序 计数 器 的 
当前 值 、 处 理 机 状态 字 、 用 户 栈 指针 和 进程 的 整个 核心 栈 。 

(14) 资源 限制 有 关 的 各 项 ,它们 保存 进程 对 资源 访问 的 上 限 。 

由 以 上 task_struct 结构 的 组 成 可 知 ,task_struct 结构 中 存放 的 是 系统 感知 进程 存在 所 
必需 的 数据 和 信息 ,以 及 进程 执行 时 所 必需 的 各 种 控制 数据 和 信息 。 


6.2.2 进程 的 虚拟 地 址 结构 


由 于 Linux 进程 的 虚拟 地 址 结构 依赖 于 硬件 ,因此 ,如 果 不 作 特 别 说 明 , 本 文 默认 那些 
与 硬件 有 关 的 部 分 都 是 依赖 于 Intel 80x86 的 。80x86 平台 中 ,每 个 进程 拥有 一 个 4GB 的 虚 
拟 空间 。 其 中 0 一 3GB 的 地 址 空间 由 用 户 进 程 使 用 ,用 户 进程 可 以 对 其 直接 访问 。3 一 4GB 
的 地 址 空间 称 为 核心 地 址 空间 ,在 所 有 的 进程 中 共享 ,存放 核心 的 正文 和 数据 ,只 被 核心 使 
用 ,用 户 进程 不 能 直接 访问 。 

Linux 将 用 户 进程 的 所 有 地 址 空间 有 关 的 信息 保存 在 一 个 名 为 mm_struct 的 数据 结构 
中 ,该 数据 结构 自身 (实际 上 是 它 的 指针 ) 则 保存 在 进程 描述 符 中 ,这 个 在 前 面 介绍 Linux 的 
进程 描述 符 的 时 候 已 经 提 到 过 
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Linux 的 进程 由 逻辑 段 组 成 的 ， Rn 存放 CPU 执行 指令 集 

合 的 正文 假 以 及 被 执行 指令 所 访问 的 数据 段 。 应 的 Linux 中 ,一 个 进程 的 虚拟 地 址 空间 
en da ee s 间 上 的 一 段 连续 区 域 ， 

是 被 共享 .保护 以 及 进行 内 存 分 配 和 地 址 变换 的 独立 实体 。 正 文 、 数 据 和 栈 分 别 存放 于 各 
的 区 中 。 在 Linux 中 虚拟 区 域 被 命名 为 vm_area, 在 核心 代码 中 通常 简写 为 VMA。 

为 了 管理 每 个 进程 中 的 区 ,系统 设 有 一 个 称 为 vm_area_struct 的 数据 类 型 ,进程 的 每 个 
区 都 对 应 一 个 vm_area_struct 结构 , 它 主 要 包括 下 列 内 容 : 

(1) 区 的 标志 位 ,指明 该 区 的 类 型 以 及 是 否 被 锁 住 ,是 否 可 共享 等 属性 。 缺 页 处 理 程序 
会 根据 地 址 所 在 区 的 标志 位 查找 缺 页 原因 ,并 做 相应 处 理 。 

(2) 区 的 起 始 地 址 和 结束 地 址 。 

(3) 共享 区 域 指针 ,给 出 共享 此 区 的 vm_area_struct 链表 。 

(4) 文件 系统 指针 ,指向 外 存 中 与 该 区 对 应 的 数据 文件 。 

(5) 此 区 域 的 操作 函数 指针 。 

在 系统 创建 新 进程 时 ,核心 将 从 父 进程 复制 相应 的 表 项 给 所 创建 的 进程 

这 里 ,要 强调 的 一 点 是 : 对 于 一 个 进程 , 它 所 有 的 区 的 地 址 范围 绝对 不 会 重大 ,两 个 区 
的 虚拟 地 址 不 一 定 连续 ,而 进程 的 虚拟 地 址 在 各 区 之 内 是 连续 的 。 

为 了 加 快 对 区 域 的 查找 和 插 和 人 删除 操作 , Linux 使 用 AVL 平衡 二 又 树 来 组 织 和 管理 
区 域 。 

对 于 用 户 进程 , 它 可 以 通过 系统 调用 mmap() 请 求 创建 一 个 虚拟 区 域 , 并 通过 munmap() 
系统 调用 加 以 释放 。 

在 虚拟 区 域 的 讨论 中 ,大 家 也 可 能 注意 到 一 点 , 即 Linux 中 的 区 和 段 页 式 管 理 中 的 段 非 
常 相像 。 所 不 同 的 是 , 段 页 式 管理 中 的 虚拟 地 址 空间 是 二 维 的 ,而 Linux 的 各 个 进程 的 分 区 
虚拟 地 址 仍 是 一 维 的 。 


6.2.3 进程 上 下 文 


在 第 3 章 中 ,已 部 分 地 介绍 了 Linux 进程 上 下 文 的 概念 。Linux 的 进程 上 下 文 是 由 正 
文 段 ,也 就 是 CPU 执行 指令 的 集合 核心 数据 结构 .有关 寄存 器 的 内 容 与 数据 段 组 成 。 

1. 进程 上 下 文 的 基本 结构 

进程 上 下 文 的 各 个 部 分 按照 一 定 的 规则 分 布 在 进程 虚拟 空间 的 不 同位 置 上 。 对 于 不 同 
的 机 器 和 硬件 结构 ,进程 上 下 文 的 分 布 规则 不 同 。 例 如 ,在 80x86 上 ,其 虚拟 地 址 空间 划分 
为 进程 空间 和 系统 空间 两 大 部 分 。 其 寻 址 范围 为 2 个 单元 , 即 4GB。 其 中 ,虚拟 空间 的 
0 一 3GB 是 进程 虚拟 空间 ,其 余 为 所 有 进程 共享 的 系统 空间 ,进程 虚拟 空间 又 分 为 多 个 虚拟 
区 域 , 分 别 保存 程序 正文 ,数据 . 堆 和 用 户 栈 。 甚 中 堆 空间 由 低 向 高 动态 延伸 ,而 栈 空 间 由 高 
向 低 动 态 延 伸 。 

在 图 6.3 中 ,核心 态 栈 (kernel stack) 是 该 进程 执行 核心 程序 时 使 用 的 ,如 上 面 所 述 , 核 
心 栈 空间 (实际 上 是 指向 它 的 指针 ) 保 存在 进程 的 进程 描述 符 中 。 该 栈 中 装 有 进程 调用 核心 
函数 时 用 到 的 有 关 人 参数 等 ,另外 ,还 包括 系统 调用 的 调用 序列 。 设 置 核心 栈 的 目的 是 使 进程 
在 执行 了 不 同调 用 顺序 的 核心 函数 之 后 , 仍 能 返回 到 原来 的 用 户 态 下 执行 。 核 心 栈 具有 多 
个 层次 ,其 中 每 层 可 保留 一 次 调用 或 中 断 处 理 后 返回 被 中 断 程序 处 继续 执行 所 必需 的 有 关 

a 汪 
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4G 
所 有 进程 共享 的 核心 态 栈 
核心 地 址 空间 | 
3G 
用 户 态 栈 
1 加 thread_info 
| | 
| 进程 描述 符 
数据 段 
代码 段 


图 6.3 进程 空间 结构 


寄存 器 的 值 。 

用 户 栈 含 有 在 用 户 态 下 执行 时 函数 调用 的 参数 、 局 部 变量 及 其 他 数据 。 图 6.4 给 出 了 
执行 copy 程序 时 用 户 栈 和 核心 栈 的 变化 例 。 图 6. 4 的 左 侧 描 述 了 当 由 main(argc,argv) 过 
程 调用 copy(old,new) ,过程 copy(old,new) 更 进一步 调用 库 函 数 write() 来 调用 write 的 
内 部 结构 。 系 统 调用 使 用 专门 的 陷阱 指令 trap, 执 行 trap 指令 将 产生 一 个 中 断 , 使 得 进程 
的 执行 模式 由 用 户 态 转换 为 核心 态 。 


用 户 栈 核心 栈 
局 部 变量 等 
3 调用 层 2 的 返回 地 址 堆栈 
write() new 增长 方向 
write() 的 参数 buf 
count 
局 部 变量 等 
屋 2 调 层 1 的 返回 地 址 
copy() old 
copy 0) 的 参数 new 
局 部 变量 等 局 部 变量 等 
= A 层 1 调用 | 三 了 at ]| 的 折 而 地 4 | 
时 1 调用 层 0 的 返回 地 址 虑 入 功能 1 | | 功能 ! 的 返回 地 址 
main() main () 的 参数 arge trap 指 令 功能 1 的 参 
参 允 argv 能 1 的 参数 


图 6.4 执行 copy 程序 时 用 户 栈 和 核心 栈 的 变化 


然后 ,用 户 态 执行 转变 为 核心 程序 执行 ,并 使 用 核心 栈 。 

进程 空间 的 用 户 进 程 正 文 段 .数据 段 ,用户 栈 以 及 有 关 的 专用 代码 和 数据 是 以 进程 为 单 
位 独立 的 ,它们 根据 需要 换 和 人 换 出 内 存 。 

2. 进程 上 下 文 的 组 成 部 分 

进程 上 下 文 由 task_struct 结构 结构 .用 户 栈 和 核心 栈 的 内 容 . 用 户 地 址 空间 的 正文 段 、 
数据 段 、 硬 件 寄 存 器 的 内 容 以 及 页 表 等 组 成 。 

task_struct 结构 在 前 文 已 经 进行 过 介绍 。 
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1) 寄存 器 内 容 

进程 上 下 文 所 包含 的 寄存 器 内 容 如 下 : 

(1) 程序 计数 器 IP 的 内 容 , 指 出 CPU 将 要 执行 的 下 一 条 指令 的 虚拟 地 址 。 

(2) 处 理 机 状态 寄存 器 的 内 容 , 称 为 处 理 机 状态 字 。 它 给 出 机 器 与 该 进程 相关 联 的 硬 
件 状态 。 例 如 运算 结果 的 标志 位 .中 断 屏 蔽 位 IO 特权 位 等 。 

(3) 栈 指针 ,指向 栈 中 下 一 项 的 当前 地 址 。 至 于 指针 是 指向 核心 栈 还 是 用 户 栈 , 则 由 
CPU 执行 方式 确定 。 

(4) 通用 寄存 器 ,用 来 存放 进程 在 执行 期 间 所 产生 的 中 间 结 果 或 参数 。 例 如 ,通用 寄存 
器 EAX 就 是 在 用 户 进 程 与 系统 进程 之 间 传 递 参 数 和 返回 值 时 用 的 。 

2) 页 表 

页 表 也 是 进程 上 下 文 的 内 容 之 一 。 它 定义 了 进程 各 部 分 从 虚拟 地 址 到 物理 地 址 的 映 
射 。 每 个 进程 都 有 自己 独立 的 页 表 , 在 进程 被 调度 的 时 候 , 调 度 过 程 会 负责 将 当前 页 表 切 换 
为 进程 的 页 表 。 正 是 页 表 使 每 个 进程 拥有 自己 的 虚拟 地 址 空间 。 

3) 进程 正文 段 和 数据 段 

进程 正文 段 .数据 段 和 用 户 栈 等 一 起 占据 进程 的 虚拟 地 址 空间 部 分 ,由 页 表 组 成 的 分 页 

地 址 变换 机 构 将 其 虚拟 地 址 变换 为 内 存 物理 地 址 。 由 于 Linux 采用 请 求 页 式 虚 存 ,因此 , 进 
程 虚拟 地 址 空间 的 许多 部 分 不 是 总 驻 留 在 内 存 中 ,这 一 点 与 UNIX 的 早期 版 本 有 区 别 , 但 
它们 仍 是 进程 上 下 文 的 一 部 分 。 


6.2.4 进程 的 状态 和 状态 转换 


正如 在 第 3 章 中 所 指出 的 那样 ,一 个 进程 的 生命 期 是 由 一 组 状态 来 刻画 的 。 这 些 状 态 
是 进程 task_struct 结构 的 一 部 分 。 

Linux 系统 中 进程 共有 6 种 基本 状态 。 

(1) TASK_RUNNING: 运行 状态 。 进程 处 在 执行 或 就 绪 状态 ,表示 正在 占用 CPU， 
或 者 在 就 绪 队 列 中 等 待 调度 ,只 要 调度 到 它 , 就 可 投入 执行 。Linux 系统 中 没有 就 绪 队列 ， 
已 就 绪 进 程 和 当前 运行 进程 的 状态 都 是 TASK_RUNNING。 

(2) TASK_INTERRUPTIBLE: 可 中 断 状态 。 进 程 正在 睡眠 ,但 是 可 以 被 软 中 断 信 号 
唤醒 。 当 收 到 信号 时 ,进程 会 从 等 待 队 列 移动 到 运行 状态 执行 信号 处 理 程序 ,如 果 优 先 级 高 
于 正在 运行 的 进程 ,将 抢占 直接 执行 。 

(3) TASK_UNINTERRUPTIBLE: 不 可 中 断 状态 。 进 程 正在 睡 眼 , 且 不 可 以 被 软 中 
断 信号 唤醒 。 

(4) TASK _STOPPED: 暂停 状态 。 表 示 进 程 的 执行 被 暂停 , 当 一 个 进程 收 到 
SIGSTOP SIGTSTP SIGTTIN 或 SIGTTOU 软 中 断 信 号 后 会 进入 这 个 状态 。 在 调试 期 
间 ,进程 收 到 任何 信号 ,也 会 停止 运行 。 

(5) TASK_TRACE: 表示 进程 被 debugger 等 进程 监视 。 

(6) TASK_ZOMBIE: 进程 执行 了 系统 调用 exit 后 ,进入 僵 死 状态 。 

图 6.5 反映 了 一 个 进程 从 被 创建 到 被 释放 的 整个 生命 周期 内 的 变化 过 程 

需要 说 明 的 是 ,如 前 面 所 描述 的 ,在 Linux 进程 描述 符 的 状态 位 中 并 不 区 分 就 绪 状 态 和 运 
行 状态 ,它们 统一 称 作 TASK __RUNNING 状态 ,而 图 中 的 睡眠 状态 在 Linux 的 状态 位 中 则 分 
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fork 
一 一 


图 6.5 进程 状态 转换 


为 可 中 断 的 TASK_INTERRUPTIBLE 状态 和 不 可 中 断 的 TASK_UNINTERRUPTIBLE 
状态 。 在 Linux 2. 6. 26 内 核 版 本 中 ,TASK_ZOMBIE 状态 分 为 EXIT_ZOMBIE 和 EXIT_ 
DEAD 两 种 ,都 保存 在 exit_state 成 员 中 。EXIT_ZOMBIE 是 指 进程 已 终止 , 正 等 待 其 父 进 
程 收集 关于 它 的 一 些 统计 信息 ;EXIT_DEAD 是 指 进程 的 最 终 状态 ,即将 进程 从 系统 中 败 
除 时 所 处 的 状态 。 另 外 ,Linux 2. 6. 26 以 上 的 内 核 版 本 还 有 TASK_DEAD 状态 和 TASK_ 
KILLABLE 状态 。TASK_DEAD 状态 是 EXIT_DEAD 状态 的 一 种 特殊 情况 ,是 在 一 个 进 
程 退 出 (调用 do_exit() ) 时 所 置 的 状态 ,是 为 了 避免 混乱 而 引入 的 ;TASK_KILLABLE 状态 
是 指 可 终止 的 进程 睡眠 状态 ,是 可 以 响应 致命 信号 的 睡眠 状态 。 为 了 在 讨论 进程 状态 转换 
的 时 候 能 够 更 清晰 地 描述 整个 状态 的 转换 过 程 ,这 里 将 Linux 的 进程 状态 按照 图 6.5 所 示 
做 了 适当 的 划分 和 合并 。 

首先 , 当 父 进程 执行 系统 调用 fork 时 ,核心 为 该 进程 分 配 task_struct 结构 并 做 必要 的 
初始 化 工作 。 初 始 化 完成 后 ,该 进程 进入 就 绪 状 态 。 此 时 ,由 于 该 进程 已 经 分 得 各 种 页 表 、 
堆栈 .正文 段 和 数据 段 所 用 的 内 存 空间 以 及 其 他 的 系统 资源 ,因此 ,该 进程 可 以 经 调度 选中 
后 占有 CPU。 

当 进 程 进入 就 绪 状 态 后 ,进程 调度 程序 将 会 在 适当 时 机 选择 该 进程 去 执行 , 当 进程 被 分 
配 到 CPU 资源 开始 执行 时 , 它 处 于 运行 状态 。 

处 于 运行 状态 的 进程 如 果 因 为 时 间 片 耗 尽 或 由 于 调度 程序 发 现 有 更 高 优先 级 的 进程 而 
被 抢占 的 时 候 , 被 剥夺 CPU 资源 而 回 到 就 绪 状 态 。 关 于 进程 调度 和 调度 的 时 机 等 问题 ,在 
后 面 的 章节 中 还 会 详细 描述 。 

当 进 程 处 于 运行 状态 时 ,用 户 程序 中 由 于 使 用 系统 调用 或 由 于 输入 输出 数据 等 操作 而 
等 待 某 事件 发 生 , 例 如 等 待 输入 输出 完成 时 ,进程 会 调用 睡眠 原 语 而 置 于 睡眠 状态 。 处 于 睡 
眠 状态 的 进程 直到 事件 发 生 后 被 唤醒 原 语 唤 醒 而 进入 就 绪 状 态 。 

还 有 一 种 情况 ,处 于 运行 态 的 进程 如 果 接 受到 某 些 软 中 断 信号 ,例如 SIGSTOP、 
SIGTSTP、SIGTTIN 或 SIGTTOU ,系统 会 将 进程 置 于 暂停 状态 。 其 中 SIGSTOP 是 由 于 
调试 程序 调用 ptrace 系统 调用 调试 目标 程序 而 触发 。 用 户 在 终端 按 SUSP 键 ( 在 PC 上 通 
常 是 Ctrl 十 Z 组合 键 ) 则 会 向 前 台 进 程 发 送 SIGTSTP 信和 号。 后 台 进 程 如 果 访 问 控制 终端 的 
话 , 则 会 收 到 SIGTTIN 或 SIGTTOU 信号 。 处 于 暂停 状态 的 进程 收 到 信号 SIGCONT 被 
唤醒 而 重新 进入 到 就 绪 状 态 。 
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最 后 ,在 进程 完成 它 所 要 求 的 任务 之 后 ,将 使 用 系统 调用 exit, 从 而 使 得 进程 进入 僵 死 
状态 而 释放 资源 。 


6.2.5 小 结 


本 节 讨 论 了 Linux 中 进程 的 虚拟 地 址 空间 ,并 介绍 了 进程 的 上 下 文 和 进程 的 状态 及 转 
换 。 进 程 的 虚拟 地 址 空间 是 进程 管理 和 内 存 管理 的 基础 ,Linux 使 用 AVL 平衡 二 又 树 管 理 
虚拟 区 域 ,使 得 对 虚拟 区 域 的 操作 更 加 高 效 。 

进程 上 下 文 是 进程 的 静态 描述 。 进 程 描 述 符 task_struct 结构 是 系统 感知 进程 存在 的 
唯一 实体 。task_struct 结构 包含 了 进程 调度 和 运行 所 需要 的 大 量 的 数据 结构 ,并 且 常 驻 内 
存 。 进 程 上 下 文中 的 正文 段 和 数据 段 是 进程 完成 所 要 求 任务 的 关键 部 分 ,通用 寄存 器 ,程序 
计数 器 以 及 处 理 机 状态 寄存 器 和 页 表 等 都 是 为 了 正文 段 的 顺利 执行 而 用 来 存放 中 间 结 果 ， 
或 传递 参数 ,或 存放 下 一 条 指令 的 虚拟 地 址 ,或 区 别 控制 CPU 的 访问 模式 和 完成 地 址 变换 
等 功能 的 。 进 程 上 下 文 各 部 分 构成 十 分 巧妙 , 缺 一 不 可 。 

另外 ,进程 可 以 在 用 户 级 对 某 些 状态 的 转换 加 以 控制 。 例 如 ,用 户 可 以 创建 进程 ,可 以 
利用 系统 调用 从 用 户 态 进入 系统 态 。 但 是 ,有 些 状态 转换 是 由 系统 控制 的 。 例 如 ,被 创建 进 
程 是 转换 到 运行 态 还 是 就 绪 态 取决 于 调度 过 程 。 有 些 状 态 转换 则 要 依靠 外 部 事件 和 系统 的 
共同 控制 。 例 如 ,一 个 处 于 睡眠 态 的 进程 何 时 能 转换 成 就 绪 态 则 依赖 于 事件 的 发 生 和 唤醒 
原 语 。 

总 之 ,进程 的 上 下 文 和 状态 转换 刻画 了 Linux 进程 的 静 、 动 两 种 特性 ,它们 是 进程 的 完 
整 反映 。 


6.3 Linux 进程 控制 


6.3.1 Linux 启动 及 进程 树 的 形成 


在 计算 机 启动 后 ,首先 得 到 处 理 的 是 BIOS 或 EFI 等 系统 固件 (firmware) ,系统 固 件 从 
磁盘 的 引导 扇 区 加 载 引 导 加 载 程序 ,例如 GRUB 或 ELILO, 引 导 加 载 程序 负责 将 Linux 系 
统 的 核心 装 和 内存 ,并 转 到 Linux 核心 所 在 的 地 址 ,开始 Linux 核心 的 初始 化 工作 。 第 一 步 
执行 的 是 一 些 和 硬件 体系 结构 有 关 的 代码 ,然后 系统 开始 执行 函数 start_kernel()。start_ 
kernel() 首 先 初始 化 系统 内 部 数据 结构 ,例如 构造 空闲 缓冲 区 、 初 始 化 区 结构 和 页 表 项 等 。 
然后 ,系统 建立 进程 0。 进程 0 将 根 文件 系 统 安 装 到 根 “/” 下 ,创建 新 进程 一 一 进程 1, 随 后 
进程 0 的 作用 就 转变 为 idle 进程 ,只 有 在 系统 中 没有 任何 进程 可 以 被 执行 的 时 候 才 会 得 到 
调度 。 进 程 1 在 系统 中 被 称 为 init 进程 。 它 是 一 个 既 可 在 核心 态 ,又 可 在 用 户 态 运 行 的 进 
程 , 它 的 正文 代码 由 调用 系统 调用 exec 执行 程序 /sbin/init 的 代码 组 成 ,init 进程 负责 初始 
化 所 有 新 的 用 户 进程 。 

init 进程 调用 exec 执行 /sbin/init 程序 后 ,为 每 个 终端 生成 一 个 子 进程 ,然后 等 待 用 户 
在 终端 上 注册 。 

用 户 在 终端 上 输入 命令 ,每 个 命令 都 对 应 一 个 可 执行 文件 。Shell 命令 解释 程序 解释 此 
命令 ,找到 相应 的 可 执行 命令 文件 ,用 系统 调用 fork 创建 子 进程 ,并 由 此 子 进程 调用 系统 调 
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进程 也 就 是 Shell 进程 则 处 于 等 待 状态 , 子 进程 执行 文件 结束 后 


用 exec 执行 此 命令 文件 ; 父 
一 条 


调用 系统 调用 exit 自我 终止 ,唤醒 父 进程 做 善后 处 理 并 转 而 显示 提示 符 , 准 备 接收 下 


命令 执行 。 
进程 启动 及 进程 树 的 形成 过 程 如 图 6.6 所 示 。 


系统 自 举 ， 将 核心 装 和 内存 


| 


启动 Linux 核心 


| 


建立 进程 0 ， 核 心 程序 执行 


| 


调用 init( ) 函 数 ， 建 立 进程 1 


| 


进程 1 调用 exec 执 行 etc/init, 建立 终端 子 进程 (Shell) 


本 


输入 命令 ， 建 立 终端 用 户 进程 


| 


调用 Shell 解 释 程序 ， 搜 索 并 解释 命令 文件 | 


fork 创建 子 进程 


四 系统 调用 子 进程 执行 ? 


子 进程 调用 exec 执 行 


| 


唤醒 父 进程 一 | 。 执行 结束 调用 exit 
显示 提示 行 


并 


图 6.6 进程 树 的 形成 


6.3.2 进程 控制 

本 节 主 要 讨论 用 户 进程 的 创建 、 执 行 和 自我 终止 问题 ,与 此 相对 应 ,Linux 系统 提供 了 
相应 的 系统 调用 fork .exec 和 exit, 以 便 在 用 户 级 上 实现 上 述 功能 。 

1. 进程 的 创建 

fork 的 功能 是 创建 一 个 子 进程 。 调 用 fork 的 进程 称 为 父 进程 。 
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系统 调用 fork 的 语法 格式 是 
pid= fork(); 


从 系统 调用 fork 返回 时 , 父 进程 和 子 进程 除了 返回 值 pid 与 task_struct 结构 中 某 些 特 
性 参数 不 同 之 外 ,其 他 完全 相同 。CPU 在 父 进程 中 时 ,pid 值 为 所 创建 子 进 程 的 进程 号 ; 若 
在 子 进程 中 时 ,pid 的 值 为 零 。 

有 关 fork 系统 调用 的 举例 ,已 经 在 第 3 章 中 作 了 介绍 ,这 里 不 再 重复 。 为 了 便于 理解 
Linux 系统 进程 的 并 发 性 ,下 面 介绍 fork 的 功能 与 实现 过 程 。 

系统 调用 fork 通过 执行 核心 程序 fork 过 程 完成 的 功能 如 下 : 

(1) 为 子 进程 分 配 一 个 进程 描述 符 task_struct 结构 ,将 父 进 程 的 进程 描述 符 的 内 容 复 
制 到 新 创建 的 结构 中 ,并 重新 设置 那些 与 父 进 程 不 同 的 数据 成 员 。 

(2) 为 子 进程 分 配 一 个 唯一 的 进程 标识 号 pid。 

(3) 将 父 进 程 的 地 址 空间 的 逻辑 副本 复制 到 子 进程 。 这 里 的 逻辑 副本 指 的 是 写 时 复制 
(copy on write) 机 制 。 因 为 大 多 数 情况 下 , 子 进 程 在 创建 以 后 会 调用 exec 系统 调用 执行 一 
个 新 程序 ,从 而 丢弃 原 有 的 地 址 空间 ,这 样 原来 做 的 地 址 空间 复制 是 一 个 极 大 的 浪费 。 
Linux 通过 写 时 复制 机 制 使 子 进程 暂时 共享 父 进 程 的 有 关 数 据 结构 ,只 有 在 子 进程 做 修改 
的 时 候 才 会 为 其 单独 复制 出 一 个 副本 ,这 样 就 减少 了 不 必要 的 复制 工作 。 

(4) 复制 父 进程 相关 联 的 有 关 文 件 系 统 的 数据 结构 和 用 户 文件 描述 符 表 。 这 样子 进程 
就 继承 了 父 进 程 的 文件 系统 相关 的 信息 。 

(5) 复制 软 中 断 信号 有 关 的 数据 结构 。 

(6) 设置 子 进程 的 状态 为 TASK_RUNNING, 把 它 加 入 到 就 绪 队 列 , 并 启动 调度 程序 。 

(7) 对 父 进 程 返回 子 进程 的 进程 标识 号 ,对 子 进程 返回 零 。 

下 面 介 绍 fork 算法 。 其 算法 流程 图 如 图 6.7 所 示 。 

在 图 6.7 中 ,系统 首先 为 子 进程 分 配 一 个 进程 描述 符 task_struct 结构 ,将 父 进程 的 进 
程 描述 符 的 内 容 复 制 到 新 创建 的 结构 中 ,并 做 必要 的 修改 。 

系统 对 用 户 同 时 拥有 的 进程 个 数 有 一 定 的 限制 ,以 免 妨碍 其 他 用 户 创建 进程 ,所 以 在 分 
配 了 子 进程 的 进程 描述 符 以 后 ,需要 对 资源 限额 做 一 个 检查 ,如 果 超 出 了 进程 资源 限额 的 话 
就 失败 并 返回 。 

下 面 ,系统 会 为 子 进 程 分 配 一 个 新 的 进程 号 ,新 创建 进程 所 分 配 的 标识 号 按 比 最 近 一 次 
分 配 的 进程 标识 号 大 1 的 顺序 递增 。 当 标识 号 达到 所 规定 的 最 大 值 之 后 则 从 0 开始 重新 
循环 。 

紧 接着 ,系统 复制 父 进程 的 文件 系统 指针 和 文件 描述 符 表 到 子 进程 ,使 得 子 进程 自动 共 
享 父 进 程 所 打开 的 文件 ,以 及 确定 子 进程 在 文件 系统 中 所 处 的 目录 位 置 ( 有 关 文 件 系 统 , 将 
在 后 面 的 章节 中 讲述 ) ,同时 复制 父 进程 的 软 中 断 信 号 的 处 理 函 数 指针 。 

然后 ,系统 设置 子 进 程 的 各 种 调度 参数 ,并 设置 父 进程 的 need_resched 标志 。 

到 这 里 子 进程 基本 被 初始 化 完毕 ,系统 会 修改 相关 进程 的 进程 描述 符 的 家 族 指针 成 员 ， 
以 反映 新 的 进程 家 族 关系 。 

最 后 通过 函数 wake_up_process() 将 子 进程 设置 为 运行 状态 ,加 入 就 绪 队 列 , 以 便 新 的 
进程 获得 运行 的 机 会 。 
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分 配 并 设置 子 进程 
的 进程 描述 符 


资源 限额 
检查 


分 配子 进程 进程 号 


1 


复制 父 进程 文件 系统 指针 
和 文件 描述 符 表 到 子 进程 


| 


复制 软 中 断 信号 处 理 程序 
相关 结构 到 子 进程 


设置 子 进程 调度 参数 
设置 父 进 程 need_resched 标志 
1 


修改 相关 进程 的 家 族 指针 成 员 


了 


设置 子 进程 为 运行 状态 , 加 入 
就 绪 状 态 


图 6.7 fork 算法 流程 图 


2. 执行 一 个 文件 的 调用 

当 父 进程 使 用 fork 创建 了 子 进程 之 后 , 子 进程 继承 了 父 进程 的 正文 段 和 数据 段 , 从 而 
限制 了 子 进程 可 以 执行 的 程序 规模 。 那 么 , 子 进程 用 什么 办 法 来 执行 那些 不 属于 父 进程 的 
正文 段 和 数据 段 呢 ? 这 就 是 利用 系统 调用 exec。 系 统 调 用 exec 引出 另 一 个 程序 , 它 用 一 个 
可 执行 文件 的 副本 覆盖 调用 进程 的 正文 段 和 数据 段 ,并 以 调用 进程 提供 的 参数 转 去 执行 这 
个 新 的 正文 段 程序 。 

系统 调用 exec 包含 6 种 不 同 的 调用 格式 ,但 它们 都 完成 同一 工作 , 即 把 文件 系统 中 的 
可 执行 文件 调 入 并 覆盖 调用 进程 的 正文 段 和 数据 段 之 后 执行 。 有 关 exec 的 各 种 系统 调用 
的 区 别 主 要 在 参数 处 理 方法 上 。 这 些 系统 调用 使 用 不 同 的 输入 参数 .环境 变量 和 路 径 变 量 。 
这 里 ,系统 调用 execvp() 和 execlp() 在 程序 中 经 常用 到 ,其 调用 格式 是 


execvp (filename, argp); 


execlp (filename, arg0, argl, ***, (cbar * )0); 
其 中 ,filename 是 要 执行 的 文件 名 指针 ,argp 是 输入 参数 序列 的 指针 ,而 0 则 是 参数 序列 的 
结束 标志 。 
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例 : 用 execlp 调用 实现 一 个 Shell 的 基本 处 理 过 程 


利用 fork 和 exec 可 实现 一 个 Shell 的 基本 功 一 一 元 
能 。 用 户 输入 命令 后 , 按 以 下 步骤 执行 用 户 命令 mA 中 | 尖 
( 见 图 6. 8) | gi exit 

(1) 利用 fork ,创建 子 进程 一 Fe 一 

(2) 利用 exec, 启 动 命令 程序 。 ~ 

(3) 利用 wait, 父 进程 和 子 进程 同步 。 

用 C 语言 实现 的 程序 代码 如 图 6.9 所 示 。 图 6.8 Shell 执行 过 程 


#include <stdio .h> 
main() 
{ 
char command[32]; 
char *prompt="$ " 
while (printf ("%s", prompt), gets (command) !=NULL) 
{ 
if (fork()==0) 
execlp (command, command, (char* )0); 
else 
wait(0); 


图 6.9 Shell 程序 的 实现 代码 


图 6.9 实现 的 Shell 中 不 包含 路 径 检索 功能 ( 即 执行 有 关 命 令 时 ,必须 把 从 根 开 始 至 命 
令 名 为 止 的 路 径 名 全 部 输入 ), 也 没有 包括 参数 处 理 功 能 。 此 例 只 是 为 了 说 明 exec 调用 的 
应 用 以 及 fork 与 exec 的 关系 。 

3. 进程 的 终止 

系统 调用 exit(rv) 自 我 终止 当前 进程 ,使 其 进入 ZOMBIE( 僵 死 ) 状 态 ,等 待 父 进程 进行 
善后 处 理 。 

exit 调用 将 导致 释放 除 task_struct 结构 之 外 的 所 有 资源 ,并 清除 进程 上 下 文 。 父 进程 
在 收 到 子 进程 的 信息 rv 和 有 关子 进程 的 时 间 信 息 之 后 ,将 释放 子 进程 的 task_struct en 
并 将 有 关 的 时 间 信 息 加 到 自己 的 task_struct 结构 的 有 关 项 中 去 。 


6.4 Linux 进程 调度 


Linux 系统 的 进程 调度 由 核心 的 调度 过 程 schedule() 实 现 。Linux 系统 中 没有 三 级 调 
度 中 的 高 级 调度 ,也 没有 中 级 调度 。 下 面 介 绍 进程 的 调度 策略 与 实现 。 

1. 调度 原理 

Linux 系统 的 进程 调度 对 实时 进程 和 普通 进程 采用 不 同 的 调度 算法 。 对 于 普通 进程 采 
用 的 是 基于 时 间 片 的 动态 优先 数 调度 法 。 即 系统 给 进程 分 配 一 个 时 间 片 ,当时 间 片 结束 时 ， 
动态 计算 该 进程 的 优先 级 , 若 优先 级 高 于 当前 内 存 就 绪 态 进程 时 ,系统 设置 调度 标识 ,在 核 
心态 转换 到 用 户 态 前 由 schedule() 过 程 调度 优先 级 高 的 进程 执行 ,并 把 被 抢先 的 进程 保存 
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到 就 绪 队 列 中 。Linux 的 进程 调度 按时 间 片 计算 优先 级 ,并 按 优先 级 的 高 低 来 调度 进程 抢 
占 处 理 机 。 因 此 Linux 系统 的 进程 调度 是 基于 时 间 片 加 优先 级 的 。 

进程 调度 涉及 的 主要 问题 如 下 : 

(1) 调度 的 时 机 。 

(2) 调度 标志 设置 。 

(3) 调度 策略 与 优先 数 的 计算 。 

(4) 调度 的 实现 。 

下 面 分 别 说 明 这 几 个 问题 。 

2. 调度 的 时 机 

在 Linux 系统 中 ,为 了 减少 操作 系统 设计 的 复杂 性 和 提高 系统 执行 效率 ,只 在 核心 的 几 
个 预定 的 位 置 进 行 调度 。 一 种 情况 是 , 当 处 理 机 从 核心 态 向 用 户 态 转 换 之 前 的 瞬间 ,核心 检 
查 当 前 进程 的 调度 标志 need_resched, 如 果 该 标志 为 1, 则 运行 调度 过 程 ,检查 各 就 绪 进 程 
的 优先 级 进行 调度 。 从 核心 态 向 用 户 态 转换 的 机 会 很 多 ,例如 从 中 断 处 理 、 陷 阱 处 理 (将 在 
后 面 章节 中 讲述 ) 和 系统 调用 等 返回 。 

另 一 种 可 以 切换 处 理 机 的 时 机 是 当 进 程 状 态 发 生变 化 时 ,直接 调用 调度 过 程 进行 调度 ， 
例如 , 当 进 程 因 申请 系统 资源 而 未 得 到 满足 ,从 而 调用 sleep() 放 弃 处 理 机 ;或 者 是 进程 为 了 
与 其 他 进程 保持 同步 而 调用 wait() 放 弃 了 处 理 机 ;或 由 于 执行 了 exit 调用 ,终止 了 当前 进 
程 。 这 几 种 情况 下 ,由 于 发 生 调 度 的 时 机 是 可 以 预见 的 ,因此 ,在 这 些 程序 执行 结束 之 前 都 
主动 调用 调度 过 程 调度 其 他 优先 级 高 的 进程 执行 。 

综 上 所 述 ,Linux 中 发 生 进程 调度 的 时 机 实质 上 有 两 个 : 一 个 是 进程 自动 放弃 处 理 机 
时 主动 转 人 调度 过 程 , 另 一 个 则 是 在 由 核心 态 转 人 用户 态 时 ,系统 设置 了 高 优先 级 就 绪 进程 
的 强迫 调度 标识 need_resched 时 发 生 调 度 。 这 两 种 情况 下 ,调度 过 程 都 是 指 schedule() 过 
程 , 后 面 会 详细 介绍 这 个 过 程 。 

在 Linux 2.6 核心 版 系统 中 ,为 支持 嵌入 式 系统 的 开发 和 实时 系统 需求 , 除 核心 的 上 述 
两 种 调度 时 机 之 外 ,还 在 内 核 中 增加 了 3 种 调度 时 机 ,允许 调度 程序 中 止 当前 进程 而 调用 更 
高 优先 级 的 进程 ,这 3 种 情况 分 别 是 : 从 中 断 或 系统 调用 返回 到 用 户 态 ; 某 个 进程 允许 被 抢 
占 CPU; 当 进程 主动 进入 休眠 状态 时 。 即 Linux 2. 6 内 核 版 本 中 进程 调度 在 一 定 程度 上 是 
可 抢占 的 ,但 也 不 是 所 有 的 内 核 代 码 段 都 可 以 被 强占 。 

3. 调度 标识 的 设置 

UNIX System V 中 有 3 个 关于 调度 和 交换 用 的 调度 标识 ,它们 是 runrun、runin 和 
runout。runrun 标识 是 要 求 处 理 机 调度 程序 进行 调度 的 标识 ,后 两 个 标识 和 交换 有 关 。 
Linux 只 使 用 一 个 调度 标识 need_resched ,该 标识 保存 在 进程 的 进程 描述 符 中 。 

在 下 面 3 种 情况 下 need_resched 标识 会 被 设置 为 1: 

(1) 当 处 于 运行 态 的 进程 的 时 间 片 耗 尽 时 ,时 钟 中 断 处 理 程序 会 设置 该 进程 的 need_ 
resched 标识 ; 

(2) 当 进 程 被 唤醒 ,而 它 的 优先 级 比 正在 运行 的 当前 进程 的 优先 级 高 的 情况 下 ,当前 进 
程 的 need_resched 标识 会 被 置 位 ; 

(3) 当 一 个 进程 通过 系统 调用 改变 调度 政策 和 nice 值 等 时 被 置 位 。 

4. 调度 策略 与 优先 数 的 计算 

Linux 把 进程 分 为 普通 进程 和 实时 进程 ,实时 进程 的 调度 优先 级 比 普 通 进程 的 要 高 ， 
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Linux 总 是 优先 调度 实时 进程 ,以 便 满足 实时 进程 对 响应 时 间 的 要 求 。 相 应 地 ,Linux 使 用 
3 种 调度 策略 ,动态 优先 数 调度 SCHED_OTHER、 先 来 先 服 务 调度 SCHED_FIFO 和 轮转 
法 调度 SCHED_RR。 其 中 动态 优先 数 调度 策略 用 于 普通 进程 ,后 两 种 调度 策略 用 于 实时 
进程 。 进 程 可 以 通过 sched_setscheduler() 系 统 调 用 选择 适合 自己 的 调度 策略 。 如 果 选 择 
了 两 种 实时 调度 中 的 任何 一 种 ,该 进程 就 转变 为 一 个 实时 进程 。 进 程 的 调度 策略 保存 在 进 
程 描述 符 中 ,并且 被 子 进 程 所 继承 ,所 以 实时 进程 的 子 进 程 仍然 是 一 个 实时 进程 。 

1) 动态 优先 数 调度 策略 

Linux 核心 通过 goodness() 函 数 计算 进程 的 优先 级 数 。 动 态 优先 数 调度 策略 从 内 存 就 
绪 队 列 中 选取 优先 数 最 大 的 进程 投入 执行 。 

goodness() 采 用 下 式 计算 各 进程 的 优先 数 : 

weight 王 counter 十 priority 一 nice 

其 中 ,counter 是 进程 可 用 的 时 间 片 的 动态 优先 级 ,进程 创建 时 父 进 程 的 counter 值 被 平分 
为 两 部 分 ,一 半 被 保留 给 父 进程 , 另 一 半 则 由 子 进 程 获得 。 由 此 可 见 fork 出 子 进 程 后 ,父子 
进程 拥有 的 时 间 片 并 不 会 增加 ,这 样 避免 了 用 户 通过 fork 子 进程 耗 尽 系统 的 CPU 资源 。 
在 时 间 中 断 中 ,当前 进程 的 counter 被 减少 ,这 样 就 逐渐 地 降低 了 正在 运行 中 的 进程 的 优先 
级 ,使 处 于 就 绪 队 列 的 低 优 先 级 的 进程 得 到 运行 机 会 。 

如 果 所 有 运行 队列 中 的 进程 的 时 间 片 都 用 完了 , 则 调度 程序 会 重新 计算 所 有 进程 (不 仅 
仅 是 运行 状态 的 进程 ) 可 用 的 时 间 片 的 优先 级 ,计算 公式 是 

counter 王 counter/2 十 nice 

这 样 处 于 等 待 或 睡眠 状态 的 进程 会 周期 性 地 得 到 提升 优先 级 别 的 机 会 。 

priority 值 是 一 个 常数 ,固定 为 20。 

nice 是 系统 允许 用 户 设置 的 一 个 进程 优先 数 偏 移 值 。Linux 中 ,nice 值 默 认为 0, 但 是 
进程 可 以 通过 系统 调用 nice() 设 置 成 一 20 一 19 间 的 一 个 数 。Linux 规定 只 有 超级 用 户 可 以 
通过 nice 系统 调用 提高 进程 的 运行 优先 级 ,而 普通 用 户 只 能 降低 进程 的 运行 优先 级 。 

2) 先 来 先 服务 调度 策略 

先 来 先 服务 调度 策略 最 早 进 入 就 绪 队 列 的 进程 ,此 策略 中 ,被 调度 的 进程 一 直 运 行 , 直 
到 具有 更 高 优先 级 的 进程 进入 就 绪 队 列 或 当前 进程 结束 或 阻塞 。 如 果 此 进程 被 抢占 , 它 继 
续 处 于 其 优先 级 队列 的 首部 ,如 果 阻 塞 的 话 , 当 它 再 次 成 为 就 绪 进 程 , 将 被 添加 到 它 所 处 的 
优先 级 队列 的 尾部 。 

3) 轮转 法 调度 策略 

轮转 法 调度 基本 和 先 来 先 服务 调度 相同 ,不 同 的 地 方 是 进程 只 执行 一 个 时 间 片 ,时间 片 
一 到 ,该 进程 就 被 加 入 到 它 所 处 的 优先 级 队列 的 尾部 。 

4) 0/1 调度 策略 

为 支持 能 入 式 系统 开发 和 多 处 理 器 并 行 处 理 ,Linux 系统 中 还 提供 了 一 种 新 的 调度 策 
略 一 一 0/1 调度 策略 。 在 系统 中 设置 了 两 个 队列 ,分别 为 活动 队列 和 过 期 队列 ,任务 就 绪 时 
被 放 入 活动 队列 中 ,调度 程序 每 隔 一 定时 间 从 活动 队列 取 任 务 ,任务 运行 时 分 配 一 个 时 间 
片 , 当 时 间 片 结束 时 ,该 任务 放弃 处 理 机 并 根据 其 优先 级 转 和 人 过 期 队列 中 。 当 活动 队列 中 的 
任务 全 部 调度 结束 后 ,两 个 队列 的 指针 互 换 , 过 期 队列 成 为 当前 活动 队列 ,调度 程序 继续 调 
度 当 前 队列 的 任务 。 

5. 调度 的 实现 

进程 调度 是 由 schedule() 过 程 实现 的 。 关 于 调用 schedule() 过 程 的 时 机 ,已 在 前 面 做 
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了 介绍 。 这 里 主要 讲述 schedule 的 执行 过 程 。 调 度 过 程 分 为 两 个 阶段 。 

第 一 个 阶段 是 进行 进程 选择 。 首 先 遍 历 进程 ,如果 进程 采用 的 是 SCHED_RR 策略 , 且 
时 间 片 已 用 完 , 则 重新 为 其 分 配 新 的 时 间 片 并 移动 到 队列 的 末尾 。 如 果 进 程 的 状态 是 
TASK_INTERRUPTIBLE 且 收 到 了 软 中 断 信号 , 则 将 其 恢复 为 就 绪 状 态 。 如 果 所 有 的 就 
绪 进 程 的 时 间 片 都 用 完了 , 则 重新 计算 所 有 进程 的 时 间 片 。 最 重要 的 工作 则 是 按照 上 述 调 
度 策略 从 所 有 进程 中 找到 具有 优先 数 最 高 的 进程 , 当 找 到 合适 的 进程 后 第 一 阶段 就 结束 了 。 
第 二 个 阶段 是 进程 的 切换 过 程 , 主 要 完成 进程 的 上 下 文 切换 ,其 中 用 户 进 程 的 地 址 空间 
的 切换 是 由 switch_mm() 过 程 完成 的 ,而 进程 的 堆栈 切换 过 程 则 由 switch_to() 实 现 。 
switch_to() 过 程 和 硬件 的 体系 结构 有 关 , 在 80x86 中 这 部 分 是 一 个 很 短 的 汇编 语言 代码 ， 
在 切换 了 堆栈 以 后 ,进程 从 上 一 次 被 中 断 的 位 置 继续 执行 。 


6.5 Linux 进程 通信 


Linux 中 的 进程 通信 分 为 3 个 部 分 : 低级 通信 、 管 道 通 信和 进程 间 通信 (Inter-Process 
Communication,IPC) 。Linux 同时 支持 计算 机 间 通 信 ( 网 络 通信 ) 用 的 TCP/IP 协议 并 提供 
了 相应 的 系统 调用 接口 。 有 关 TCP/IP 协议 及 其 有 关系 统 调 用 已 超出 了 本 书 的 范围 ,这 里 


6.5.1 Linux 的 低级 通信 

Linux 的 低级 通信 主要 用 来 传递 进程 间 的 控制 信号 ,主要 是 文件 锁 和 软 中 断 信 号 机 制 。 
软 中 断 信 号 的 目的 是 通知 对 方 发 生 了 异步 事件 。Linux 中 有 31 个 软 中 断 信 号 和 32 个 实时 
软 中 断 信 号 , 软 中 断 信号 的 作用 见 表 6. 1。 实 时 软 中 断 信 号 的 编号 为 32 一 63。 它 们 没有 预 
先 定义 的 含义 ,和 普通 软 中 断 信号 的 区 别 在 于 实时 信号 可 以 排队 而 不 会 发 生 丢 失 的 现象 。 


表 6.1 Linux 软 中 断 信 号 


软 中 断 号 符号 名 功 能 符号 名 功 能 
1 SIGHUP 用 户 终端 连接 结 SIGCHLD 子 进程 消亡 
区 SIGINT 键盘 按 DELETE 键 SIGCONT 继续 进程 的 执行 
E: SIGQUIT 键盘 按 QUIT 键 SIGSTOP 停止 进程 的 执行 
4 SIGILL 非法 指令 SIGTSTP 键盘 按 SUSP 键 
5 SIGTRAP | 断 点 或 跟踪 指令 SIGTTIN 后 台 进程 读 控制 终端 
6 SIGABRT | 程序 ABORT SIGTTOU 后 台 进 程 写 控制 终端 
7 SIGBUS 非法 地 址 SIGURG socket 收 到 紧急 数据 
8 SIGFPE 浮 点 溢出 SIGXCPU 超过 CPU 资源 限制 
9 SIGKILL 要 求 终止 该 进程 SIGXFSZ 超过 文件 资源 限制 
10 SIGUSR1 用 户 定义 SIGVTALRM | 虚拟 时 钟 定时 信号 
11 SIGSEGV ”| 段 违 例 SIGPROF 虚拟 时 钟 定时 信号 2 
12 SIGUSR2 用 户 定 义 SIGWINCH 窗口 大 小 改变 
13 SIGPIPE PIPE 只 有 写 者 ,无 读者 SIGIO IO 就 绪 
14 SIGALRM | 时 钟 定时 信号 SIGPWR 电源 失效 
15 SIGTERM | 软件 终止 信号 SIGSYS 系统 调用 错 
16 SIGSTKFLT| 协 处 理 器 的 堆栈 异常 


软 中 断 是 对 硬件 中 断 的 一 种 模拟 ,发 送 软 中 断 就 是 向 接收 进程 的 task_struct 结构 中 的 
相应 项 发 送 表 6. 1 中 的 一 个 信号 。 接 收 进程 在 收 到 软 中 断 信号 后 ,将 按照 事先 的 规定 去 执 
行 一 个 软 中 断 处 理 程 序 。 但 是 , 软 中 断 处 理 程序 不 像 硬 中 断 处 理 程序 那样 收 到 中 断 信 号 后 
立即 被 启动 , 它 必 须 等 到 接收 进程 执行 时 才能 生效 。 另 外 一 个 进程 也 可 以 向 自己 发 送 软 中 
断 信号 ,以 便 在 某 些 意外 的 情况 下 ,进程 能 转 入 规定 好 的 处 理 程序 。 例 如 ,大 部 分 陷阱 都 是 
由 当前 进程 向 自己 发 送 一 个 软 中 断 信 号 而 立即 转 入 相应 处 理 的 。 

为 了 给 用 户 进程 也 提供 相应 的 同步 、 互 斥 以 及 软 中 断 通信 功能 ,Linux 系统 提供 了 几 种 
相应 的 系统 调用 或 库 函 数 。 其 中 文件 锁 库 函 数 lockf() 可 以 用 于 互 斥 ,其 格式 是 


lockf (fd, function, size) 


其 中 ,fd 是 被 锁定 文件 标识 ,文件 标识 必须 使 用 只 写 权 限 (O_WRONLY ) 或 读 写 权限 (O_ 
RDWR) 打 开 ;function 是 控制 值 ,F_LOCK 表示 锁定 一 个 文件 的 某 个 区 域 ,F_UNLOCK 表 
示 不 再 锁定 ,F_TLOCK 用 来 测试 和 锁定 一 个 程序 段 ,F_TEST 则 用 来 测试 待 锁 定 的 程序 段 
是 否 已 被 其 他 进程 锁定 。size 表示 要 锁定 或 解锁 的 连续 字 节 数 , 如 果 size 等 于 零 , 则 表示 锁 
定 从 调用 lockf 后 到 文件 结尾 的 区 域 。 

lockf 在 Linux 中 是 通过 fcntl 系统 调用 实现 的 ,用 户 进程 也 可 以 直接 用 fcntl 系统 调用 
使 用 文件 锁 。 

用 于 同步 的 系统 调用 是 wait() 或 sleep(z) 。 其 中 ,wait() 用 于 父子 进程 之 间 的 同步 ,而 
sleep 则 使 得 当前 进程 睡眠 n 秒 后 自动 唤醒 自己 。 

系统 调用 kill(pid, sig) 和 signal(sig, func) 被 用 来 传递 和 接收 软 中 断 信 号 。 一 个 用 户 
进程 可 调用 kill(pid，sig) 向 另 一 个 标识 号 为 pid 的 用 户 进程 发 送 软 中 断 信 号 sig。 根 据 表 
6.1 可 知 ,用 户 可 以 定义 的 软 中 断 号 是 10 或 12。 另 外 ,标识 号 为 pid 的 进程 通过 signal 
Csig,func) 捕 捉 到 信号 sig 之 后 ,执行 预先 约定 的 动作 func, 从 而 达到 这 两 个 进程 通信 的 目 
的 。 一 个 经 常用 到 的 例子 是 signal(SIGINT, SIG_IGN) ,表示 当前 进程 不 做 任何 指定 的 工 
作 而 忽略 键盘 中 断 信号 的 影响 。 


6.5.2 进程 间 通 信 


UNIX System V 版 本 设计 了 一 套 进 程 间 通 信 (IPC) 的 机 制 , 后 来 被 称 为 System V 
IPC。 它 解决 了 UNIX 早期 版 本 在 进程 间 通 信 方 面 的 弱点 。 在 System V IPC 机 制 被 开发 
出 来 之 前 ,通信 能 力 一 直 是 UNIX 系统 的 一 个 弱点 ,因为 只 能 利用 pipe 来 传递 大 量 数 据 。 
而 pipe 又 存在 着 只 有 调用 pipe 的 进程 的 子孙 后 代 才 能 使 用 它 进行 通信 的 缺点 。 虽 然 有 名 
管道 能 使 非 同 族 进程 之 间 相 互通 信 ,但 它们 不 能 复 用 一 个 有 名 管道 以 便 为 多 对 通信 进程 提 
供 私 用 通道 。 也 就 是 说 有 名 管道 不 能 识别 其 通信 伙伴 ,也 不 能 有 选择 地 接收 信息 。System 
V IPC 机 制 解决 了 这 些 弱 点 ,Linux 则 完整 地 继承 了 System V IPC。 

System V IPC 有 3 个 组 成 部 分 : 

(1) 消息 Cmessage) 用 于 进程 之 间 传 递 分 类 的 格式 化 数据 。 

(2) 共享 存储 器 (shared memory) 方 式 可 使 得 不 同 进程 通过 共享 彼此 的 虚拟 空间 而 达 
到 互相 对 共享 区 操作 和 数据 通信 的 目的 。 

(3) 信和 号 量 (semaphore) 机 制 用 于 通信 进程 之 间 的 同步 控制 。 信 和 号 量 通常 与 共享 存储 
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器 方式 一 起 使 用 。 

由 于 上 述 3 种 方式 是 作为 一 个 整体 实现 的 ,因此 ,它们 具有 下 述 共同 性 质 : 

(1) 每 种 机 制 都 用 两 种 基本 数据 结构 来 描述 : 

Q@ 索引 表 。 其 中 一 个 表 项 由 关键 字 访问 控制 结构 及 操作 状态 信息 组 成 。 每 个 索引 表 
项 描述 一 个 通信 实例 或 通信 实例 的 集合 。 

@ 实例 表 。 一 个 实例 表 项 描述 一 个 通信 实例 的 有 关 特 征 。 例 如 ,消息 机 制 中 消息 队列 
表 相 当 于 索引 表 , 而 消息 头 表 则 相当 于 实例 表 , 如 图 6. 10 所 示 。 
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图 6.10 索引 表 与 实例 表 的 关系 


(2) 索引 表 项 中 的 关键 字 是 一 个 大 于 零 的 整数 , 它 由 用 户 选择 名 字 。 

(3) 索引 表 的 访问 控制 结构 中 含有 创建 该 表 项 进程 的 用 户 id 和 用 户 组 id, 由 后 述 
control 类 系统 调用 ,可 为 用 户 和 同 组 用 户 设置 读 - 写 -执行 许可 权 。 从 而 起 到 通信 保护 的 
作用 。 

(4) 每 种 通信 机 制 的 control 类 系统 调用 可 用 来 查询 索引 表 项 中 的 状态 ,以 及 置 状 态 信 
息 或 从 系统 中 删除 表 项 。 

(5) 除了 control 类 系统 调用 之 外 ,每 种 通信 机 制 还 含有 一 个 get 类 系统 调用 ,以 创建 
一 个 新 的 索引 表 项 或 者 用 于 获得 已 建立 的 素 引 表 项 的 描述 字 。 

(6) 每 一 种 索引 表 项 都 使 用 下 列 公式 计算 索引 表 项 的 描述 字 。 

描述 字 三 SEQ_MULTIPLIERX 分 配 序号 十 索引 表 项 下 标 

其 中 SEQ_MULTIPLIER 是 索引 表 长 度 的 上 限 , 目 前 为 32768。 例 如 , 表 项 1 的 描述 
字 可 以 是 32769、65537、98305 等 。 这 样 做 的 好 处 是 , 当 进程 释放 了 一 个 旧 的 索引 表 项 , 且 该 
索引 表 项 又 分 配给 另外 的 进程 时 ,因为 分 配 序号 的 增加 将 使 得 描述 字 改 变 , 从 而 原来 的 进程 
不 可 能 再 次 访问 该 表 项 。 由 此 ,可 以 起 到 通信 保护 作用 。 

其 他 系统 调用 访问 索引 表 项 时 的 索引 值 为 (描述 字 )mod( 索 引 表 长 度 ) 。 

下 面 ,简单 地 介绍 3 种 通信 机 制 的 系统 调用 。 

1. 消息 机 制 

消息 机 制 提供 4 个 系统 调用 : 


int msgget (key t key, int msgfl1g) 
int msgctl (int msgqid, int cmd, struct msqid ds* buf) 
int msgsnd(int msgqid, struct msgbuf * msgp, size t msgsz, int msgf1g); 
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ssize t msgrcv (int msgqid, struct msgbufx msgp, size t msgsz, long msgtyp, int msgf1g) 7， 


这 些 系统 调用 所 需要 的 数据 结构 和 表格 都 放 在 头 文件 二 sys/types. h>、 二 sys/ipc. hb 
和 扫 sys/msg.h> 中 。 因 此 ,在 使 用 各 种 通信 机 制 的 系统 调用 之 前 ,必须 include 这 3 个 头 
文件 。 

系统 调用 msgget 返回 一 个 消息 描述 字 msgqid,msgqid 指定 一 个 消息 队列 以 便 其 他 3 
个 系统 调用 使 用 。key 和 msgflg 具有 获取 的 语义 。key 可 以 等 于 关键 字 IPC_PRIVATE， 
以 保证 返回 一 个 未 用 的 空 表 项 ,key 还 可 以 被 设置 成 一 个 还 不 存在 表 项 描述 字 的 表 项 号 。 
这 时 ,只 要 msgflg&IPC_CREAT 为 真 , 则 系统 会 生成 一 个 新 的 表 项 并 返回 描述 字 。 例 如 : 


msgqid=msgget (MSGKEY, 0777) 


在 MSGKEY 所 对 应 的 消息 队列 表 项 不 存在 时 ,将 创建 该 表 项 ;在 MSGKEY 所 对 应 的 
表 项 存在 时 ,msgget 返回 该 表 项 的 描述 字 。 

系统 调用 msgctl 用 来 设置 和 返回 与 msgqid 相关 联 的 参数 选择 项 ,以 及 用 来 删除 消息 
描述 符 的 选择 项 。cmd 的 取 值 范围 为 {IPC_STAT,IPC_SET,IPC_RMID}。 其 中 ,IPC 
SET 表示 将 指针 为 buf 中 的 用 户 id 等 读 入 与 msgqid 相关 联 的 消息 队列 表 项 中 ;IPC_ 
STAT 表示 将 与 msgqid 相关 的 消息 队列 表 项 中 所 有 当前 值 读 入 buf 所 指 的 用 户 结构 中 ;而 
IPC_RMID 则 表示 msgctl 调用 删除 msgqid 所 对 应 的 消息 队列 表 项 。buf 是 用 户 空间 中 用 
于 设置 或 读 取消 息 队 列 状态 的 索引 结构 指针 。 

系统 调用 msgsnd 和 msgrcv 则 分 别 表示 发 送 和 接收 一 个 消息 。msgsnd Cmsgqid， 
msgp,msgsz,msgflg) 中 的 msgqid 是 msgget 返回 的 消息 队列 描述 符 ;msgp 则 是 用 户 消息 
缓冲 区 指针 ;msgsz 是 消息 正文 的 长 度 ;而 msgflg 则 是 同步 标识 ,规定 msgsnd 发 送 消息 时 ， 
是 发 送 完毕 后 返回 还 是 不 等 发 送 完毕 立即 返回 (此 时 msgflg&IPC_NOWAIT 为 真 ) 。 

系统 调用 msgrcv 中 比 msgsnd 多 一 个 参数 msgtyp, 它 规定 接收 消息 的 类 型 。msgtyp 
三 0 时 ,表示 接收 与 msgqid 相关 联 的 消息 队列 上 的 第 一 个 消息 ;msgtyp 二 0 时 ,表示 接收 与 
msgqid 相关 联 的 消息 队列 上 msgtyp 类 型 的 第 一 个 消息 ;而 msgtyp 达 0 时 , 则 表示 接收 小 于 
或 等 于 msgtyp 绝对 值 的 最 低 类 型 的 第 一 个 消息 。 男 外 ,msgflg 指示 当 与 msgqid 相关 联 的 
消息 队列 上 无 消息 时 系统 应 当 怎 么 办 。 

例如 ,图 6.11 和 图 6.12 分 别 给 出 了 用 C 语言 编写 的 ,由 顾客 进程 和 服务 者 进程 调用 的 

序 例子 。 


#include <sys/types.h> 
#include <sys/ipc.h> 
#include <sys/msg.h> 
#define MSGKEY 75 
struct msgform 
{ 

long mtype; 

char mtext [256]; 


图 6.11 顾客 进程 的 程序 段 
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main () 
. 
struct msgform msg; 
int msgqid, pid, *pint; 
msgqid=msgget (MSGKEY, 0777); 消息 队列 * / 
Pidq=getpid (); 
pint= (intx ) msg.mtext; 


*xpint=pid; 

msg.mtype=1; /* 指定 消息 类 型 */ 

msgsnd (msgqid, gmsg, sizeof (int),0); /x* 往 msgqid 发 送 消息 msgx / 
msgrcv (msgqid, gmsg, 256,pid,0); /< 接收 来 自 服务 进程 的 消息 * / 


printf ("client : receive from pid%d\n", * pint); 


图 6.11 ( 续 ) 


#include <sys/types.h> 
#include <sys/ipc.h> 
#include <sys/msg.h> 
#define MSGKEY 75 
struct msgform 
{ 
long mtype; 
char mtext [256]; 
} msg; 
int msgqid; 
main () 
{ 
int 1, pid, *pints 
extern cleanup (); 
for (i=0; i<20; i++) /x* 软 中 断 处 理 * / 
signal (i, cleanup); 
msgqid=msgget (MSGKEY, 0777|IPC CREAT); /* 建立 与 顾客 进程 相同 的 消息 队列 * / 
For (28) 
{ 
msgrcv (msgqid, &msg, 256, 1, 0); /* 接收 来 自 顾客 进程 的 消息 * / 
pint= (int * ) msg.mtext; 
pid= * pint; 
printf("server: receive from pid %$d\n", pid); 
msg.mtype=pid; 
< pint=getpid (); 
msgsnd (msgqid, &msg, sizeof (int), 0); /* 发送 应 答 消息 x* / 


} 
cleanup () 


msgctl1 (msgqid, IPC RMID, 0); 
exit (); 


图 6.12 服务 者 进程 的 程序 段 
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图 6. 11 是 顾客 进程 。 该 进程 向 服务 者 进程 发 送 一 个 含有 进程 号 pid 以 及 类 型 为 1 的 
消息 ,向 服务 者 进程 发 出 服务 请 求 。 然 后 ,从 服务 者 进程 接收 相应 的 回答 或 服务 。 

在 图 6. 11 中 ,MSGKEY 是 用 户 自己 定义 的 关键 字 , 已 在 本 书 前 面部 分 做 过 说 明 。 而 
msgform 则 是 用 户 自 定义 的 发 送 消息 正文 和 消息 类 型 ,这 一 消息 被 定义 为 256B 长 。 紧 接 
着 ,顾客 进程 首先 使 用 系统 调用 msgget 创建 ,或 得 到 与 关键 字 MSGKEY 相关 联 的 消息 队 
列 描述 字 msgqid, 并 由 库 函 数 getpid() 得 到 该 进程 ID。 接 下 去 是 对 消息 正文 做 类 型 转换 ， 
以 便 计算 消息 长 度 并 将 进程 ID 复制 到 消息 正文 中 。 最 后 ,顾客 进程 调用 msgsnd 把 消息 
msg 挂 入 以 msgqid 为 描述 字 的 消息 队列 ,并 从 该 队列 接收 服务 进程 发 往 该 进程 的 第 一 个 消 
息 (用 进程 号 pid 作 消 息 类 型 ) 。 

图 6. 12 是 服务 者 进程 。 该 进程 首先 检查 是 否 捕捉 到 由 kill 发 来 的 软 中 断 信 号 。 如 果 
捕捉 到 时 , 则 调用 函数 cleanup 从 系统 中 删除 以 msgqid 为 描述 字 的 消息 队列 。 如 果 它 捕捉 
不 到 软 中 断 信 号 或 者 接收 的 是 不 能 捕 提 的 SIGKILL(9) 信 号 , 则 该 消息 队列 继续 保留 在 系 
统 中 ,而 且 在 该 队列 被 删除 以 前 试图 以 该 关键 字 建 立新 消息 队列 的 尝试 都 会 失败 。 

然后 ,服务 者 进程 使 用 系统 调用 msgget ,并 在 msgget 中 置 位 IPC_CREAT 来 建立 一 个 
消息 队列 结构 。 紧 接着 ,服务 者 进程 接收 所 有 类 型 为 1 的 ,也 就 是 从 顾客 进程 来 的 请 求 消 
息 。 这 是 由 系统 调用 msgrcv 完成 的 。 在 接收 到 消息 之 后 ,服务 者 进程 从 消息 中 读 出 顾客 
进程 的 ID, 并 将 返回 的 消息 类 型 置 为 顾客 进程 的 ID。 然 后 ,服务 者 进程 把 要 发 送 的 消息 复 
制 到 消息 正文 域 中 ,并 使 用 msgsnd 将 消息 挂 人 msgqid 为 描述 字 的 消息 队列 。 本 例 中 ,由 
服务 者 进程 发 送 给 顾客 进程 的 消息 也 是 服务 者 进程 的 ID。 

在 消息 机 制 中 ,消息 被 格式 化 为 类 型 与 数据 对 , 且 人 允许 不 同 的 进程 根据 不 同 的 消息 类 型 
进行 接收 ,这 是 使 用 管道 通信 所 无 法 办 到 的 。 

2. 共享 存储 区 机 制 

进程 能 够 通过 共享 虚拟 地 址 空间 的 若干 部 分 ,然后 对 存储 在 共享 存储 区 中 的 数据 进行 
读 和 写 来 直接 地 彼此 通信 。 操 纵 共 享 存储 区 的 系统 调用 类 似 于 消息 机 制 , 共 有 4 个 系统 
调用 


int shmget (key t key, size t size, int shmf1g) 7 

void* shmat (int shmid, const voidx shmaddr, int shmflg); 
int shmdt (const voidx shmaddr); 

int shmctl (int shmid, int cmd, struct shmid ds* buf); 


shmget 建立 新 的 共享 区 或 返回 一 个 已 存在 的 共享 存储 区 描述 字 。 其 中 ,key 是 用 户 指 
定 的 共享 区 号 ,size 是 共享 存储 区 的 长 度 , 而 shmflg 则 与 msgget 中 的 msgflg 含义 相同 。 

shmat 将 物理 共享 区 附 接 到 进程 虚拟 地 址 空间 。 其 中 shmid 是 shmget 返回 的 共享 区 
描述 字 , 而 shmaddr 是 将 共享 区 附 接 到 其 上 的 用 户 虚 拟 地 址 , 当 shmaddr 二 0 时 系统 自动 选 
择 适 当地 址 进行 附 接 (默认 )。shmflg 规定 对 此 区 是 否 是 只 读 的 ,以 及 核心 是 否 应 对 用 户 规 
定 的 地 址 作 舍 入 操作 。shmat 返回 系统 附 接 该 共享 区 后 的 虚拟 地 址 。 

shmdt 进程 从 其 虚拟 地 址 空间 断 接 一 个 共享 存储 区 。 其 中 ,shmaddr 是 shmat 返回 的 
虚拟 地 址 。 

shmetl 查询 及 设置 一 个 共享 存储 区 状态 和 有 关 参 数 。 其 中 ,shmid 是 共享 存储 区 的 描 
述 字 ,cmd 规定 操作 类 型 ,而 buf 则 是 用 户 数据 结构 的 地 址 ,这 个 用 户 数据 结构 中 含有 该 共 
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享 存储 区 的 状态 信息 。 
用 户 可 以 使 用 上 述 4 个 系统 调用 为 通信 进程 建立 ` 附 接 以 及 断 接 共享 存储 区 。 共 享 存 
储 区 的 好 处 在 于 为 通信 进程 提供 了 直接 通信 的 手段 ,使 得 通信 进程 可 以 直接 访问 彼此 的 某 
些 虚 拟 空间 。 这 既 减 少 了 数据 流动 所 带 来 的 硬 软 件 开销 (例如 缓冲 区 及 其 管理 等 ) ,又 使 得 
彼此 的 通信 不 仅仅 局 限于 数据 的 发 送 与 接收 ,而 且 可 以 互相 操作 彼此 的 某 些 虚拟 存储 区 。 
图 6. 13 给 出 两 进程 共享 存储 区 的 示意 图 。 
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图 6.13 共享 存储 区 示意 图 


共享 存储 区 建立 后 可 以 被 附 接 到 一 个 进程 的 多 个 虚拟 区 间 上 ,而 一 个 进程 的 虚拟 
Cause 
需要 指出 的 是 ,共享 存储 区 机 制 只 为 通信 进程 提供 了 访问 共享 存储 区 的 操作 条 件 ,而 对 
通信 的 同步 控制 则 要 依靠 后 述 的 信号 量 机 制 等 才能 完 
图 6. 14 和 图 6. 15 分 别 给 出 了 将 进程 附 接 到 共享 存储 区 上 ,以 及 进 程 间 共享 存储 区 的 
语言 程序 实例 。 


#include <sys/types.h> 
#include <sys/ipc.h> 
#include <sys/shm.h> 
#define SHMKEY 75 
#define K 1024 
int shmid; 
main () 
{ 
int 1 *pints 
char x* addr; 
extern char * shmat (); 
extern cleanup(); 
for (i= 0; i<20; i++) /* 软 中 断 处 理 
signal (i, cleanup); 
shmid=shmget (SHMKEY, 16xK, 0777|IPC _CREAT); /x 建立 16KB 共享 区 SHMKEY*x/ 
addr=shmat (shmid, 0, 0); /* 共享 区 首 地 址 x* / 
printf ("addr 0xsxNn" addr); 
pint= (int * )addr; 
for (i=0; i<256; i++) 
关 pint++=i; 
pint= (int * )addr; /* 共享 区 第 一 个 字 中 写 入 长 度 256, 以 便 接收 进程 读 * / 
x pint=256; 


图 6.14 共享 存储 区 程序 实例 
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pause () 

} 

cleanup () 
Shmct1 (shmid, IPC RMID, 0); 
exit (); 


/* 等 待 接收 进程 读 * / 


图 6. 14 ( 续 ) 
在 图 6. 14 中 ,该 进程 建立 了 16KB 的 共享 存储 区 ,并 将 存储 区 附 接 到 了 虚拟 地 址 addr 
上 。 然 后 ,从 该 存储 区 的 起 始 单元 开始 ,顺序 写 入 0 一 255 个 自然 数 。 如 果 该 进程 捕捉 到 一 
个 软 中 断 信号 (SIGKILL 除外 ), 则 由 系统 调用 shmctl 删除 该 共享 区 。 


# :include <sys/types.h> 
# include <sys/ipc.h> 
# :include <sys/shm.h> 
#define SHMKEY 75 
#define K 1024 
int shmidq; 
main () 
{ 
int i, x*xpint; 
char x* addr; 
extern char * shmat (); 
shmid= shmget (SHMKEY, 8¥* K, 0777); 
addr=shmat (shmid, 0, 0); 
pint= (int * )addr; 
while (x* pint==0); 
for (i=0; i<256; * pint++) 
printf ("Sd\n"; * pint++)? 


/* 取 共享 区 SHMKEY 的 idx/ 
/* 连接 共享 区 x* / 


/* 共享 区 的 第 一 个 字 节 为 零 时 ,等 待 * / 
/* 打印 共享 区 中 内 容 * / 


图 6.15 共享 存储 区 程序 实例 
在 图 6.15 中 另 一 个 进程 附 接 到 与 关键 字 SHMKEY 相关 联 的 存储 区 上 。 也 就 是 与 
图 6. 14 所 述 的 同一 个 存储 区 上 。 为 了 表明 每 个 进程 可 以 附 接 一 个 共享 存储 区 的 不 同 总 量 ， 
图 6. 15 中 只 取 该 存储 区 的 8KB。 该 进程 等 待 着 直到 图 6. 14 中 进程 在 共享 存储 区 中 的 第 一 
个 字 节 写 人 一 个 非 零 值 后 读 出 该 存储 区 ;此 时 图 6. 14 进程 暂停 以 使 图 6. 15 进程 执行 读 出 


打印 操作 。 
3. 信和 号 量 机 制 


信号 量 机 制 是 基于 第 3 章 所 述 的 PV 原 语 原理 的 。UNIX System V 中 一 个 信号 量 由 


以 下 几 部 分 组 成 : 


(1) 信号 量 的 值 , 是 一 个 大 于 、 小 于 或 等 于 零 的 整数 。 


(2) 最 后 一 个 操纵 信号 量 的 进程 的 进程 id。 


(3) 等 待 着 信号 量 值 增加 的 进程 数 。 
(4) 等 待 着 信号 量 值 等 于 零 的 进程 数 。 


信号 量 机 制 提供 下 列 系统 调用 对 信号 量 进 行 创建 .控制 以 及 P、V 操作 是 : 
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(1) 用 于 产生 一 个 信号 量 数组 以 及 得 以 存 取 它们 的 系统 调用 semget (semkey, count， 
flag)。 其 中 ,semkey 和 flag 类 似 于 建立 消息 和 共享 存储 区 时 的 这 些 参数 。semkey 是 用 户 
指定 的 关键 字 ,count 规定 信号 量 数组 的 长 度 ( 如 图 6. 16 所 示 ) ,flag 为 操作 标识 。semget 
用 来 创建 信号 量 数组 或 查找 已 创建 信号 量 数组 的 描述 字 。 例 如 : 


semid=semget (SEMKEY, 2, 07771IPC CREAT); 


创建 一 个 关键 字 为 SEMKEY 的 含有 两 个 元 素 的 信号 量 数组 。 


信号 量 序号 
信号 量 集合 表 信号 量 数组 NA 
KEY, ~ 0 1 2 3 | 4 5 
KEY, en 1 | sem2 | sem3 | sem4 | sem5 | sem6 


图 6.16 信号 量 数组 


(2) 用 于 P、V 操作 的 系统 调用 semop(semid,oplist,count) 。 其 中 ,semid 是 semget 返 
回 的 描述 字 ,oplist 是 用 户 提供 的 操作 数组 的 指针 ,count 是 该 数组 的 大 小 。semop 返回 在 
该 组 操作 中 最 后 被 操作 的 信号 量 在 操作 完成 前 的 值 。 

用 户 定 义 的 操作 数组 中 的 每 个 元 素 包 含 3 个 内 容 , 它 们 是 信号 量 序号 .操作 内 容 ( 对 信 
号 量 进行 P 操 作 或 V 操作 的 值 ) 和 标识 。 一 个 数组 可 同时 包含 对 n(n 二 1) 个 信号 量 的 操作 。 

semop 根据 操作 数组 所 规定 的 操作 内 容 改 变 信号 量 的 值 。 如 果 操 作 内 容 为 正 数 (V 操 
作 ), 则 将 该 信号 量 增加 该 操作 内 容 的 值 ,并 唤醒 所 有 等 待 此 信号 量 值 增加 的 进程 。 如 果 操 
作 内 容 为 零 , 则 semop 检查 信号 量 的 值 , 若 为 零 ,semop 执行 对 同一 操作 数组 中 其 他 信号 量 
的 操作 ;否则 ,上 废弃 本 次 系统 调用 所 完成 的 所 有 信号 量 操作 之 后 ,调用 sleep 使 该 进程 进入 
睡眠 状态 。 如 果 操 作 内 容 是 负数 且 绝对 值 小 于 等 于 信和 号 量 值 , 则 semop 从 信和 号 量 值 中 减 去 
操作 内 容 ; 和 否则 ,调用 sleep 让 该 进程 睡眠 在 等 待 信号 量 值 增加 的 事件 上 。 例 如 : 


struct sembuf { 
unsigned short sem num; 
short sem op; 
short sem flg; 
} Psembuf; 
semid=semget (SEMKEY ,2 ,0777); 
Psembuf.sem num=first; 
Psembuf.sem op=-1; 
Psembuf .sem flg=SEM UNDO; 


semop (semid ,&Psembuf,1); 
定义 了 一 个 对 二 元 信号 量 数 组 中 第 一 个 信号 量 的 P 操 作 。 其 中 SEM_UNDO 是 为 了 保证 P 
操作 的 原子 性 而 设置 的 标识 。 

(3) 对 信号 量 进行 控制 操作 的 系统 调用 semctl(semid, number, cmd, arg)。 其 中 ， 
semid 是 semget 返回 的 信号 量 的 描述 字 ,number 是 对 应 于 semid 的 信号 量 数 组 的 序号 ， 
cmd 是 控制 操作 命令 ,arg 是 控制 操作 参数 ,是 一 个 union 结构 。 
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union semun { 
int val 
struct semid dsx buf 
unsigned short* array; 


}arg 


系统 根据 cmd 的 值 解释 arg, 并 完成 对 信号 量 的 删除 .设置 或 读 信号 量 的 值 等 操作 。 有 
关 semctl 的 操作 命令 ,由 于 较 多 和 比较 复杂 ,这 里 不 再 深入 讨论 。 

上 面 介绍 了 有 关 IPC 的 3 种 通信 机 制 。 这 3 种 机 制 使 用 消息 和 共享 存储 区 方式 使 多 个 
进程 使 用 同一 介质 (消息 队列 或 共享 存储 区 ) 进 行 通信 。 这 优 于 管道 等 通信 方式 。 但 是 ,由 
于 各 系统 调用 中 使 用 的 关键 字 的 语义 很 难 扩展 到 一 个 网 络 上 (不 同 的 机 器 上 同一 关键 字 可 
以 描述 不 同 的 对 象 ) ,因此 IPC 仍 是 属于 单一 机 器 环境 下 的 通信 机 构 。 


6.6 Linux 存储 管理 


存储 管理 部 分 还 需要 对 物理 内 存 进 行 有 效 的 分 配 和 释放 。 同 时 内 存 是 一 种 有 限 的 资 
源 ,无 法 容 下 全 部 活动 进程 。 所 以 存储 管理 系统 必须 决定 哪个 进程 的 哪个 部 分 应 该 放 在 内 
存 , 并 管理 那些 不 在 内 存 又 属于 同一 进程 虚空 间 的 部 分 。 因 此 Linux 系统 必须 解决 为 进程 
分 配 内 存 空 间 进行 内 存 扩充 .完成 由 虚 存 到 物理 存储 器 的 地 址 变换 以 及 内 存 信 息 保护 与 共 
享 等 问题 。 

Linux 采用 请 求 调 页 策略 进行 存储 器 管理 。 早 期 的 UNIX 系统 只 采用 交换 技术 进行 主 
存 扩充 。 交 换 技 术 与 请 求 调 页 策略 的 主要 区 别 在 于 : 交换 技术 换 入 换 出 整个 进程 (task_ 
struct 结构 和 共享 正文 段 除外 ), 因 此 一 个 进程 的 大 小 受 物理 存储 器 的 限制 ;而 请 求 调 页 策 
略 在 内 存 和 外 存 之 间 来 回 传递 的 是 存储 页 而 不 是 整个 进程 ,从 而 使 得 进程 的 地 址 映射 具有 
了 更 大 的 灵活 性 , 且 人 允许 进程 的 大 小 比 可 用 物理 存储 空间 大 得 多 。 


6.6.1 虚 存 空间 和 管理 


内 存 管理 和 硬件 的 体系 结构 相关 。 本 节 以 80x86 为 例 , 说 明 Linux 的 地 址 空间 划分 和 
存储 管理 的 基本 思想 。 

80x86 微 处 理 器 内 部 有 一 个 段 页 式 的 内 存 管理 单元 (mmu) 。 其 中 分 段 单元 由 6 个 段 寄 
存 器 以 及 由 操作 系统 在 内 存 中 构造 的 段 描述 符 表 共同 作用 ,用 于 将 逻辑 地 址 转换 为 虚拟 地 
址 (在 Linux 中 也 称 为 线性 地 址 ) 。 

一 个 逻辑 地 址 由 段 标识 符 和 段 内 地 址 组 成 ,例如 ,cs:0x1000 表示 的 逻辑 地 址 处 于 cs 
段 , 段 内 偏 移 量 为 0x1000。 

段 的 详细 信息 由 一 个 8 字 节 的 段 描述 符 表 示 , 段 描 述 符 说 明了 该 段 的 起 始 位 置 . 长 度 、 
段 的 类 型 特征 .特权 级 别 和 段 的 属性 。 所 有 的 段 描述 符 保存 在 两 个 段 描述 符 表 中 ,一 个 称 为 
全 局 描述 符 表 (GDT), 男 一 个 称 做 局 部 描述 符 表 (LDT)。 而 段 寄 存 器 的 作用 就 是 作为 一 个 
索引 (Intel 官方 的 描述 是 段 选 择 符 ) 。 处 理 器 的 分 段 单元 通过 段 寄 存 器 的 内 容 可 以 查找 到 
相应 的 段 描述 符 ,并 进行 权限 验证 和 地 址 转换 。 

Linux 实际 上 只 是 非常 有 限 地 使 用 80x86 的 分 段 机 制 。 基 本 上 Linux 只 是 为 了 满足 
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80x86 的 要 求 而 最 低 限 度 地 使 用 了 分 段 机 制 。 这 人 么 做 的 原因 有 两 个 : 第 一 个 原因 是 分 页 机 
制 已 经 足以 满足 Linux 对 内 存 管理 的 需求 ;第 二 个 原因 是 Linux 需要 工作 在 众多 的 硬件 平 
台 上 ,而 80x86 以 外 的 硬件 平台 上 对 分 段 机 制 的 支持 功能 并 不 像 80x86 这 么 强大 和 完善 。 
所 以 忽略 Linux 对 分 段 机 制 的 处 理 并 不 会 对 理解 Linux 的 内 存 管理 部 分 产生 太 大 的 影响 ， 
下 面 就 不 再 详细 描述 了 。 

80x86 的 分 页 单元 由 页 目录 基地 址 寄存 器 CR3 以 及 由 操作 系统 在 内 存 中 构造 的 页 目 
录 表 和 页 表 共 同 作 用 ,用 于 将 分 段 单元 转换 后 的 虚拟 地 址 转换 为 相应 的 物理 地 址 。 

80x86 的 地 址 空间 被 分 页 单元 划分 成 以 4KB 为 1 页 的 线性 数组 ,页 的 编码 范围 为 (0 一 
2” 一 1)。 分 页 单元 总 是 以 页 面 为 最 小 的 处 理 单位 。 转 换 过 程 如 下 : 32 位 的 虚拟 地 址 的 值 
被 分 为 3 个 部 分 ,分 别 是 页 目录 地 址 、 页 表 地 址 和 页 内 地 址 。 分 页 单元 通过 CR3 寄存 器 找 
到 页 目录 表 的 基地 址 ,虚拟 地 址 中 的 页 目录 部 分 作为 页 目录 表 的 偏 移 量 访问 到 页 目录 项 ,其 
中 的 内 容 就 是 要 访问 的 页 表 的 基地 址 ,虚拟 地 址 中 的 页 表 地 址 作为 页 表 的 偏 移 量 访问 到 页 
表 项 ,其 中 的 内 容 就 是 要 访问 的 页 面 的 基地 址 。 最 后 将 页 表 的 基地 址 加 上 虚拟 地 址 中 的 页 
内 地 址 就 得 到 了 物理 地 址 。 虚 拟 地 址 的 示意 图 如 图 6.17 所 示 。 


页 目录 地 址 | 页 表 地 址 页 内 地 址 


-EL 


CR3 
页 目录 基地 址 


图 6.17 虚拟 地 址 的 内 容 


页 表 项 的 内 容 如 图 6. 18 所 示 。 


7 6 5 4 3 2 1 0 
第 7~0 位 | 0 | D | A | 0 0 | U/S | RW | P 
第 15~8 位 3~0 位 页 面 地 址 OS 专用 0 
第 23~16 位 11~4 位 页 面 地 址 
第 31~24 位 19~12 位 页 面 地 址 


图 6.18 页 表 项 内 容 


其 中 比较 重要 的 有 P( 有 效 ) 位 、D( 修 改 ) 位 .A( 访 问 ) 位 和 RW( 读 写 ) 位 。 

第 0 位 (最 低位 ) 是 有 效 位 P, 如 果 P 二 1, 则 表示 该 虚 页 所 对 应 的 内 容 在 内 存 中 , 且 第 12 
一 31 位 所 对 应 的 是 该 虚 页 的 页 面 基地 址 。P 二 0 时 , 则 该 虚 页 不 在 内 存 , 硬 件 将 产生 相应 的 
出 错 信息 并 转 由 操作 系统 处 理 。 
第 5 位 是 访问 位 A, 指 示 最 近 是 否 有 进程 访问 过 该 页 ,该 位 用 于 请 求 调 页 算法 ,后 面 将 
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一 步 介 绍 。 
第 6 位 是 修改 位 DD, 在 内 存 中 ,第 一 次 对 该 页 面 进行 写 操作 修改 该 页 面 内 容 后 ,要 将 该 
位 置 1, 以 便 将 其 换 出 时 写 回 磁盘 保存 最 新 信息 。 如 果 D=0, 则 由 于 磁盘 上 保存 了 该 页 副 
本 ,从 而 换 出 时 不 必 写 回 外 存 而 减少 不 必要 的 I/O 操作 。 
Linux 中 每 个 进程 拥有 自 Se 目录 和 页 表 , 在 进程 调度 的 时 候 调 度 过 程 会 将 进程 的 
页 目录 的 地 址 保存 到 CR3 寄存 器 ,这 样 就 切换 了 进程 的 整个 地 址 空间 。 所 以 每 个 进程 都 拥 
有 自己 独立 的 3G ra 


6.6.2 请 求 调 页 技术 


当 出 现 缺 页 异常 的 时 候 ,Linux 的 缺 页 异常 处 理 过 程 被 调用 , 它 通过 检查 地 址 所 属 的 虚 
拟 区 域 的 属性 判断 是 否 是 非法 的 访问 ,如 果 是 非法 访问 , 则 向 进程 发 送 SIGSEGYV 信号 终止 
用 户 进 程 ,否则 进入 请 求 调 页 处 理 过 程 。 

当 页 表 有 效 位 P=0 时 ,由 有 效 位 定义 可 知 ,进程 所 要 访问 的 页 不 在 内 存 中 。 此 时 该 页 
会 有 以 下 几 种 情况 : (1) 该 页 面 是 首次 被 访问 ,还 没有 分 配 过 物理 页 面 。(2) 该 页 在 外 存 的 
文件 中 ,例如 可 执行 文件 或 其 他 通过 mmap 系统 调用 访问 的 文件 。(3) 该 页 在 外 存 交 换 区 
中 。 针 对 这 3 种 不 同 的 情况 ,系统 除了 要 在 内 存 中 分 配 或 淘汰 相应 的 页 面 以 调 人 这些 页 之 
外 ,还 要 正确 区 分 这 些 页 所 在 的 位 置 ,以便 迅 速 地 将 所 需要 的 页 调 人 内 存 。 

当 整 个 页 表 项 为 0 时 ,说 明 的 是 前 两 种 情况 ,这 时 Linux 需要 通过 地 址 所 在 的 虚拟 区 域 
的 属性 来 判断 。 如 果 虚 拟 区 域 对 应 一 个 磁盘 文件 ,说 明 是 情况 (2) ,这 时 会 为 其 分 配 内 存 , 并 
将 磁盘 文件 的 相应 内 容 读 到 分 配 到 的 内 存 中 ;如 果 区 域 不 对 应 于 一 个 磁盘 文件 ,说 明 是 情况 
(1) ,这 时 候 根据 请 求 的 是 读 操作 还 是 写 操 作 有 不 同 的 处 理 : 

(1) 写 操作 ,没有 优化 的 手段 ,直接 为 其 分 配 空间 。 

(2) 读 操作 ,因为 是 第 一 次 访问 ,这 段 地 址 空间 的 内 容 应 该 全 部 是 0, 所 以 Linux 并 不 为 
其 分 配 物理 内 存 , 而 是 把 一 个 在 内 核 初始 化 时 静态 分 配 的 特殊 的 页 面 映射 到 这 个 页 面 地 址 
(这 个 特殊 的 页 面 称 为 零 页 , 它 的 内 容 全 部 是 0) ,同时 把 页 表 项 设置 为 只 读 的 。 这 样 当 下 次 
进程 试图 对 其 进行 写 操作 的 时 候 会 触发 写 时 复制 机 制 , 直 到 那 时 候 才 为 其 真正 分 配 物 理 
内 存 。 

写 时 复制 机 制 在 描述 进程 创建 过 程 的 时 候 就 提 到 过 。 这 里 再 详细 描述 一 下 写 时 复制 是 
怎么 对 进程 创建 起 作用 的 。 这 里 的 重点 是 进程 创建 的 时 候 父 进程 的 页 被 设置 为 和 子 进 程 共 
享 , 且 将 页 的 保护 位 设置 为 只 读 的 ,而 不 是 为 子 进程 分 配 新 的 页 面 并 复制 父 进程 的 页 面 的 内 
容 。 当 父 进程 或 子 进 程 试图 写 这 个 页 面 的 时 候 , 缺 页 异常 处 理 过 程 会 判断 出 该 页 面 是 共享 
的 ,并 为 其 重新 分 配 页 面 并 复制 内 容 , 并 且 将 页 的 保护 标志 设置 为 可 写 的 ,下 次 再 对 该 页 面 
进行 写 操作 就 不 会 再 次 触发 访问 异常 。 因 为 子 进 程 在 创建 以 后 往往 马上 调用 exec 系统 调 
用 运行 一 个 新 的 程序 ,而 放弃 父 进程 的 地 址 空间 ,这 样 写 时 复制 避免 了 很 多 不 必要 的 复制 工 
作 ,从 而 节省 了 时 间 。 

下 面 继续 请 求 调 页 的 描述 , 当 页 表 项 不 为 空 的 时 候 , 说 明 访 问 的 页 在 交换 区 中 。 这 时 候 
页 表 项 的 内 容 就 是 该 页 在 交换 区 中 的 索引 。 通 过 这 个 索引 Linux 就 可 以 找到 保存 在 交换 区 
的 页 面 内 容 , 并 将 其 复制 到 新 分 配 的 页 面 。 

Linux 可 以 使 用 多 个 交换 设备 ,系统 为 每 个 交换 设备 定义 了 一 个 swap_info_struct 结 
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构 ,该 结构 描述 了 此 交换 设备 的 设备 号 .大 小 和 优先 级 等 信息 。Linux 按照 优先 级 顺序 依次 
访问 交换 设备 ,只 有 高 优先 级 的 交换 设备 用 完了 的 时 候 才 会 开始 使 用 低 优 先 级 的 交换 设备 。 
所 以 页 表 项 中 交换 区 索引 实际 上 包含 了 交换 设备 的 索引 号 和 交换 设备 内 页 面 索引 号 两 个 
部 分 。 

1. 交换 缓冲 

因为 Linux 在 某 些 情况 下 页 面 是 在 进程 间 共 享 的 , 当 一 个 进程 的 页 面 被 换 出 到 交换 设 
备 的 时 候 ,并 没有 简单 的 方法 可 以 找到 所 有 共享 该 页 的 进程 。 所 以 Linux 把 一 个 共享 页 面 
交换 出 去 的 时 候 , 并 不 立刻 释放 该 页 面 , 而 是 把 该 页 面 保 存 到 交换 缓冲 区 中 ,只 有 在 所 有 该 
页 面 的 引用 被 交换 出 去 后 , 才 有 机 会 释放 该 页 面 。 所 以 请 求 调用 的 调 人 过 程 中 , 换 人 过 程 首 
先 需 要 检查 该 页 是 否 在 交换 缓冲 区 中 ,如 果 是 的 话 , 就 没有 必要 启动 不 必要 的 1/O 操作 进 
行 换 入 了。 

利用 上 述 几 种 数据 结构 可 将 请 求 调 页 时 的 基本 处 理 过 程 描述 如 下 : 

当 P 二 0, 即 发 生 缺 页 时 ,核心 先 检 查 缺 页 原因 ,如 果 是 已 经 被 换 出 到 交换 分 区 的 情况 ， 
检查 交换 缓冲 区 。 如 果 交 换 缓 冲 区 中 存在 一 个 对 应 的 页 面 , 则 不 必 启 动 交换 设备 或 交换 文 
件 ,而 直接 从 交换 缓冲 区 中 移出 该 页 即 可 。 图 6. 19 给 出 了 该 调 入 过程 的 流程 图 。 


合法 的 
访问 


是 


写 访 问 且 该 
VMA 段 可 写 


征 


是 


读 交换 ( 分配 雪 页 ) (分 本 页 面 ) 


图 6. 19 请 求 调 页 的 调和 基本 处 理 过 程 


例如 , 当 进 程 访问 虚拟 地 址 1493K 时 ,页 表 项 中 有 效 位 P 二 0 从 而 发 生 缺 页 。 此 时 ,由 
磁盘 块 描述 项 得 到 该 虚拟 地 址 (1493K) 所 对 应 的 外 存 页 面 在 逻辑 设备 号 为 1、 块 号 为 2743 
处 ; 且 由 页 表 项 可 知 , 在 该 页 换 出 内 存 前 所 对 应 的 内 存 页 面 号 为 794。 然 后 ,由 图 6. 20 中 的 
处 理 流程 ,首先 根据 页 面 号 794 检查 交换 缓冲 区 ,发 现 页 面 794 中 的 数据 或 程序 还 在 缓冲 区 
中 。 从 而 只 需 从 缓冲 区 中 把 794 号 页 移 到 内 存 而 不 必 启 动 外 部 设备 。 


» 164。 


2. 页 面 换 出 过 程 

上 述 过 程 只 是 请 求 调 页 中 的 调和 人 过程 。Linux 将 未 被 使 用 的 物理 页 作为 系统 的 缓冲 区 
和 块 设备 的 缓冲 区 ,如 果 内 存 中 已 无 足够 的 页 面 存放 调 入 页 ,Linux 首先 通过 减少 各 种 缓冲 
区 的 大 小 来 满足 进程 的 需要 。 如 果 这 样 仍然 不 够 ,系统 必须 淘汰 相应 的 内 存 页 面 以 存放 刚 
调 入 的 页 。 考 虑 到 效率 ,Linux 在 两 种 情况 下 进行 页 面 的 换 出 工作 。 一 个 是 在 分 配 内 存 的 
时 候 发 现 空 闲 内 存 低 于 某 个 极限 值 时 , 另 一 个 是 使 用 kswapd 核心 线程 每 10 秒 1 次 周期 性 
地 换 出 内 存 。 

第 一 种 情况 下 换 出 操作 的 统一 入 口 是 try_to_free_pages() 函数 。 首 先 检查 缓冲 区 , 缓 
冲 区 按照 最 近 是 否 访 问 过 分 为 两 个 链表 ,一 个 是 最 近 访问 过 的 , 称 为 active_list; 另 一 个 是 最 
近 没 有 访问 过 的 , 称 为 inactive_list。 核 心 从 active_list 的 队 尾 向 前 检查 每 一 个 页 面 ,如 果 
该 页 的 访问 标志 为 真 , 则 将 其 移动 到 active_list 的 队列 表 头 ,否则 将 其 加 入 inactive_list 的 
表 头 。 随 后 从 inactive_list 的 队 尾 向 前 检查 ,如 果 该 页 没有 被 对 象 引 用 , 则 将 其 释放 ,否则 
将 其 移动 到 inactive_list 的 表 头 。 注 意 这 里 页 面 的 释放 不 会 涉及 交换 分 区 的 操作 ,因为 这 
些 缓冲 区 的 内 容 都 对 应 磁盘 上 的 文件 ,不 需要 浪费 交换 分 区 的 空间 。 

如 果 通 过 释放 部 分 缓冲 区 仍然 不 能 满足 要 求 , 系 统 会 遍历 各 进程 的 地 址 空间 ,检查 页 面 
对 应 的 页 表 项 的 访问 标志 ,同样 如 果 访 问 标志 不 为 真 ,认为 最 近 没 有 访问 过 ,从 而 释放 其 空 
间 ,在 这 种 情况 下 ,因为 页 面 不 对 应 磁盘 上 的 文件 ,需要 在 交换 分 区 为 其 申请 空间 ,并 将 交换 
出 去 的 页 面 保存 到 交换 分 区 中 。 

Linux 第 二 种 情况 下 的 换 出 操作 的 入 口 是 balance_pgdat() 了 艺 数 ,其 换 出 操作 的 过 程 和 
try_to_free_pages() 函 数 类 似 。 

由 此 可 见 ,Linux 的 内 存 淘 汰 策略 是 近似 的 最 近 最 少 使 用 (LRU) 算 法 。 

3. 反 向 映射 (reverse mapping) 

在 页 面 换 出 过 程 中 ,需要 查找 所 有 关联 了 该 物理 页 面 的 页 表 项 ,并 逐一 更 新 这 些 页 表 
项 ,为 了 快速 定位 引用 了 某 个 物理 页 面 的 所 有 页 表 项 ,Linux 2.6 中 采用 了 反 向 映射 机 制 。 
这 种 机 制 的 基本 思想 就 是 建立 物理 页 面 和 所 有 映射 了 该 物理 页 面 的 页 表 项 之 间 的 关联 , 操 
作 系 统 为 此 设置 了 反 向 映射 链表 ,链表 上 的 节点 应 用 了 该 物理 页 面 所 对 应 的 虚拟 内 存 区 域 
(vm_area_struct 结构 ) ,虚拟 内 存 区 域 通过 内 存 描 述 符 (mm_struct 结构 ) 找 到 页 全 局 目录 ， 
从 而 找到 相应 的 页 表 项 ,这 种 方法 能 节省 内 存 空 间 , 并 使 遍历 反 向 映射 链表 时 消耗 时 间 减 
少 , 从 而 在 很 大 程度 上 减少 了 操作 系统 在 页 面 回收 上 所 占用 的 CPU 时 间 。 


本 章 小 结 


本 章 从 Linux 中 进程 的 概念 出 发 ,介绍 了 Linux 中 进程 动 . 静 两 方面 的 特性 以 及 描述 方 
法 ,然后 ,介绍 了 Linux 的 进程 创建 .调度 .执行 和 撤销 等 的 控制 手段 .方法 以 及 相应 的 用 户 
接口 。 除 此 之 外 ,还 讨论 了 Linux 的 进程 通信 部 分 ,包括 用 于 同步 与 互 斥 等 控制 用 的 低级 通 
信和 以及 大 量 传递 信息 的 IPC 机 制 。 最 后 ,介绍 了 与 进程 管理 息息相关 的 存储 管理 部 分 。 

对 于 进程 的 概念 来 说 ,本 章 重点 强调 了 进程 是 在 进程 上 下 文中 执行 这 个 概念 。 为 了 深 
入 掌握 这 一 概念 ,首先 必须 对 什么 是 进程 上 下 文 有 一 个 清楚 的 认识 。 本 章 重 点 介绍 了 进程 
上 下 文 的 各 个 组 成 部 分 以 及 进程 上 下 文 的 切换 方法 。 
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除了 进程 0 之 外 ,Linux 的 所 有 进程 都 是 由 父 进程 创建 生成 的 。 在 父 进 程 创建 生成 子 
进程 时 ,系统 要 为 子 进 程 生成 自己 的 上 下 文 ,这 就 需要 调用 6. 6 节 所 述 的 存储 管理 程序 为 其 
分 配 task_struct 结构 和 进程 页 表 等 。 如 果 内 存 中 无 足够 的 空间 ,或 超出 了 用 户 资源 限额 ， 
则 无 法 生成 子 进程 。 在 子 进程 创建 成 功 之 后 ,马上 就 看 到 了 子 进程 和 父 进程 并 发 执行 ,抢占 
处 理 机 的 现象 。 至 于 谁 先 抢 得 处 理 机 ,要 依靠 调度 程序 决定 。Linux 的 调度 策略 是 基于 优 
先 级 的 , 即 选取 优先 级 最 高 者 (优先 数 最 小 者 ) 占据 处 理 机 。 但 是 ,优先 级 的 计算 又 是 与 时 
间 片 有 关 的 。 因 此 Linux 的 调度 是 基于 优先 级 加 时 间 片 的 。 

另外 ,Linux 系统 没有 作业 的 概念 ,用 户 必须 在 一 个 进程 的 控制 之 下 和 系统 进行 会 话 ， 
所 输入 的 数据 也 必须 先 送 到 内 存 工 作 区 之 后 ,再 由 进程 决定 是 否 写 人 外 存 文件 系统 保存 。 

进程 通信 一 直 是 早期 UNIX 系统 较 弱 的 一 部 分 ,但 IPC 机 构 弥 补 了 这 一 点 。Linux 的 
IPC 提供 了 消息 、 信 号 量 及 共享 存储 区 等 大 量 信息 传递 方法 。 不 过 ,IPC 机 构 只 能 在 一 台 机 
器 内 使 用 ,不 能 扩展 到 网 络 通信 上 ,这 是 它 最 大 的 弱点 。 

Linux 的 存储 管理 策略 是 请 求 调 页 。 请 求 调 页 系统 只 把 进程 的 部 分 页 面 放 和 内存 ,其 
他 大 部 分 页 面 在 需要 时 再 请 求 调 入 。 因 此 ,进程 大 小 不 再 受 内 存 大 小 的 限制 。 

系统 将 一 个 进程 的 虚拟 空间 分 为 不 同 的 虚拟 区 域 ,每 个 区 对 应 一 个 vm_area_struct 结 
构 ,用户 进程 通过 mmap 和 munmap 系统 调用 申请 和 释放 虚拟 区 域 。 


习 是 


6.1 简 述 Linux 系统 进程 的 概念 。 

6.2 Linux 进程 上 下 文 由 哪 几 部 分 组 成 ? 为 什么 说 核心 程序 不 是 进程 上 下 文 的 一 部 分 ? 
进程 页 表 也 在 核心 区 ,它们 也 不 是 进程 上 下 文 的 一 部 分 吗 ? 

6.3 假定 在 用 户 态 下 执行 的 某 个 进程 用 完了 它 的 时 间 片 ,由 于 时 钟 中 断 的 原因 ,核心 调度 
一 个 新 进程 去 执行 。 请 形式 化 地 描述 出 新 、 旧 进程 的 上 下 文 切换 过 程 。 


6.4 Linux 的 调度 策略 是 什么 ?调度 时 应 该 封锁 中 断 吗 ? 如 果 不 封 锁 ,会 发 生 什么 问题 ? 
6.5 试 述 进程 0 的 作用 。 

6.6 Linux 在 哪儿 种 情况 下 发 生 调 度 ? 

6.7 编写 一 个 程序 ,利用 fork 调用 创建 一 个 子 进 程 ,并 让 该 子 进程 执行 一 个 可 执行 文件 。 
6.8 什么 是 软 中 断 ? 

6.9 进程 在 什么 时 候 处 理 它 接 收 到 的 软 中 断 信 号 ? 进程 接收 到 软 中 断 信号 后 放 在 什么 


地 方 ? 

6. 10 ”Shell 符号 二 二 将 输出 追加 到 一 个 指定 的 文件 中 ,如 果 指 定 文 件 不 存在 , 则 该 命令 创 
建 该 文件 并 将 输出 写 和 人 其 中 ;否则 , 它 打开 该 文件 并 在 该 文件 中 数据 尾部 接着 写 和 。 
编写 实现 之 之 的 C 语言 代码 。 

11 编写 一 个 程序 ,比较 使 用 共享 存储 区 和 消息 机 制 进行 数据 传输 的 速度 。 

12 形式 化 地 描述 Linux 中 消息 机 制 的 通信 原理 。 

13 Linux 存储 管理 策略 中 交换 和 请 求 调 页 方式 有 何 区 别 ? 

14 在 图 6. 20 所 示 请 求 调 页 的 调和 处理 过 程 中 ,有 可 能 出 现 空 闪 页 面 链表 中 的 页 面 内 容 
不 同 于 外 存 设备 上 的 页 面 内 容 的 情况 ,此 时 应 取 哪 一 个 页 面 调和 内存? 为 什么 ? 

6.15 简要 总 结 Linux 进程 管理 与 存储 管理 部 分 的 联系 。 
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第 7 章 Windows 的 进程 与 内 存 管理 


作为 完全 的 32 位 Windows 版 本 ,Windows NT 代表 了 微软 公司 Windows 操作 系统 发 
展 中 的 主流 体系 结构 。 因 此 ,我 们 将 基于 Windows NT 体系 结构 的 微软 操作 系统 ,如 
Windows NT、Windows 2000、Windows XP 和 Windows Server 2003, 作为 本 书 介 绍 
Windows 操作 系统 的 实例 对 象 。 

Windows 的 系统 服务 和 应 用 程序 都 是 以 进程 的 形式 驻 留 在 内 存 中 的 ,处 理 器 通过 调度 
这 些 进程 的 执行 来 完成 计算 任务 。 本 章 以 Windows 为 例 ,介绍 进程 与 内 存 管 理 的 方法 。 
Windows 是 多 线程 操作 系统 ,处 理 器 调度 是 以 线程 为 基本 单位 的 。 因 此 ,本 章 在 讲解 进程 
的 同时 ,也 将 介绍 Windows 线程 的 概念 和 结构 。 


7.1 Windows NT 的 特点 及 相关 的 概念 


作为 Windows 操作 系统 的 组 成 部 分 ,我 们 在 讲解 进程 管理 和 内 存 管 理 时 ,不 可 避免 地 
会 涉及 与 Windows 操作 系统 体系 结构 和 管理 机 制 相 关 的 知识 和 概念 。 为 了 帮助 理解 ,本 节 
将 简单 介绍 与 进程 和 内 存 管理 相关 的 Windows NT 的 体系 结构 和 有 关 的 概念 。 


7.1.1 Windows NT 体系 结构 的 特点 


微软 公司 将 Windows NT 作为 替代 包括 Windows 95 和 它 之 前 的 各 个 Windows 版 本 
的 主流 操作 系统 , 它 在 进程 和 内 存 管理 有 关 的 体系 结构 设计 上 有 一 些 特 点 。 

。 Windows NT 是 支持 多 处 理 器 的 操作 系统 。 

。 Windows NT 是 完全 的 32 位 操作 系统 ,设计 了 4GB 大 小 的 虚拟 地 址 空间 ,其 中 
2GB 的 地 址 空间 用 作 进 程 的 私有 空间 。 
Windows NT 支持 16 位 的 Windows 代码 ,并 为 其 提供 独立 的 运行 空间 。 
Windows NT 对 访问 共享 内 存 的 进程 有 严格 的 安全 限制 。 
Windows NT 的 系统 内 存 空 间 只 能 在 核心 态 被 访问 。 

随 着 计算 机 体系 结构 和 Windows 家 族 的 发 展 , Windows NT 内 核 版 本 也 升级 到 6.0 版 
本 以 上 ,新 的 内 核 版 本 支持 64 位 操作 系统 ,具有 更 多 的 新 特点 : 

。 新 版 本 增强 了 Active Directory ,使 用 了 新 的 虚拟 化 和 管理 ,采用 了 IIS 7. 5。 

。 可 支持 多 达 64 个 物理 处 理 器 或 最 多 256 个 系统 的 逻辑 处 理 器 。 
可 支持 Live Migration( 动 态 迁 移 ) ,支持 虚拟 磁盘 动态 调整 容量 ,及 VM 内 存 动态 配 
置 功 能 ,能 以 虚拟 镜像 文件 于 实体 主机 上 开机 。 
可 支持 无 线 广域网 ,网 络 驱动 程序 接口 规范 为 6.20, 支 持 AVCHD 摄影 机 以 及 通用 
视频 类 型 1. 1 。 
能 支持 新 的 用 户 模 式 调度 框架 。 
能 完整 支持 S800、S1600 以 及 S3200 数据 传输 速率 的 IEEE 1394b 的 火线 (IEEE 
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1394) 堆 栈 。 
7.1.2 Windows 的 管理 机 制 


下 面 介 绍 Windows 的 一 些 管理 机 制 ,以 帮助 理解 下 面 关于 进程 管理 和 内 存 管理 的 
描述 。 

1. 核心 态 (Kernel Mode) 和 用 户 态 (User Mode) 

为 了 保证 操作 系统 的 稳定 性 和 安全 性 ,Windows 将 处 理 器 的 运行 模式 分 为 核心 态 和 用 
户 态 。 用 户 的 应 用 程序 运行 在 用 户 态 ,而 操作 系统 的 内 核 代 码 和 设备 驱动 程序 则 运行 在 核 
心态 。 处 在 用 户 态 的 应 用 程序 不 能 直接 对 操作 系统 的 内 核 数 据 直 接 访问 ,必要 时 只 能 通过 
操作 系统 提供 的 系统 调用 ,将 请 求 转 到 核心 态 系 统 服 务 。 处 理 器 模式 也 切换 到 核心 态 ,运行 
完 请 求 后 再 返回 调用 的 用 户 程 序 , 并 切换 到 用 户 态 继续 运行 。 因 此 ,一 个 用 户 线程 在 执行 
时 ,往往 一 部 分 时 间 运 行 在 用 户 态 , 另 一 部 分 时 间 通 过 系统 调用 运行 在 核心 态 。 

运行 于 核心 态 的 操作 系统 服务 可 以 访问 所 有 的 系统 内 存 和 所 有 的 CPU 指令 ,可 以 利 
用 所 有 的 计算 机 资源 来 完成 复杂 的 系统 管理 。Windows 对 运行 于 用 户 态 的 应 用 所 能 访问 
的 系统 资源 有 很 多 限制 ,从 而 保护 了 核心 的 系统 资源 不 受 侵害 。 

所 有 运行 于 核心 态 的 系统 服务 和 设备 驱动 程序 都 共享 同一 系统 地 址 空间 ,这 样 可 以 减 
少数 据 交换 的 中 间 环 节 , 从 而 提高 系统 效率 。 同 时 也 使 得 开发 操作 系统 相对 于 开发 普通 应 
用 更 加 复杂 ,开发 人 员 需 要 处 理 对 复杂 的 系统 结构 和 资源 的 管理 。 

用 户 态 进程 拥有 自己 独立 的 虚拟 地 址 空间 , 它 不 能 访问 系统 地 址 空间 中 的 数据 ,也 不 能 
直接 访问 其 他 用 户 进 程 的 地 址 空间 。 这 种 设计 将 进程 执行 错误 所 引起 的 损害 限制 在 出 错 进 
程 内 ,保证 了 操作 系统 的 和 其 他 应 用 运行 的 稳定 性 。 

2. Windows 操作 系统 的 体系 结构 

Windows 操作 系统 是 由 运行 在 用 户 态 和 核心 态 的 一 些 构件 组 成 的 ,一 般 将 运行 于 核心 
态 的 构件 称 为 核心 系统 服务 ,而 将 运行 于 用 户 态 的 构件 称 为 用 户 进程 。 

Windows 的 用 户 进程 一 般 包 括 以 下 几 种 : 

。 操作 系统 支持 进程 。 如 用 于 用 户 登 录 的 进程 会 话 管理 进程 等 。 它 们 虽然 是 操作 系 
统 中 必 不 可 少 的 一 部 分 ,但 它们 运行 在 用 户 态 ,用 于 管理 用 户 和 操作 系统 的 会 话 。 
服务 进程 。 许 多 基于 操作 的 应 用 服务 器 ,如 SQL Server 和 Exchange Server 等 ,用 
于 提供 各 种 应 用 服务 ,也 运行 在 用 户 态 。 

应 用 程序 。 所 有 的 用 户 应 用 程序 都 运行 在 用 户 态 。 
环境 子 系统 服务 进程 。 为 了 支持 多 种 操作 系统 应 用 的 运行 ,如 Windows 16 位 和 32 
位 应 用 、MS DOS 应 用 、POSIX 32 位 应 用 和 OS/2 32 位 应 用 ,Windows 包含 了 多 个 
环境 子 系统 进程 ,为 相应 的 程序 提供 运行 环境 。 当 应 用 程序 需要 进行 系统 调用 时 ， 
首先 需要 通过 对 相应 的 子 系统 动态 链接 库 的 调用 ,将 相关 的 调用 转换 成 对 标准 的 系 
统 服务 的 调用 ,再 切换 到 核心 态 运 行 。 

Windows 的 核心 系统 服务 一 般 包 括 以 下 几 种 : 

。 Windows 执行 体 。 它 是 运行 在 核心 态 的 系统 服务 ,用 于 管理 进程 和 线程 ,管理 内 存 ， 

管理 设备 ,提供 系统 安全 、 网 络 以 及 进程 间 通信 等 服务 。 

。 Windows 内 核 。 它 为 执行 体 提供 底层 系统 服务 ,管理 线程 调度 .中 断 和 意外 处 理 、 多 
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处 理 器 同步 等 。 

。 设备 驱动 程序 。 它 运行 在 核心 态 , 管 理 硬件 设备 和 处 理 IO 请 求 。 

。 硬件 抽象 层 。 它 对 不 同 的 计算 机 环境 (主要 是 主板 上 的 硬件 ) 提 供 标准 的 系统 封装 ， 
使 得 其 他 的 系统 服务 在 设计 时 实现 和 硬件 无 关 。 

。 窗口 和 图 形 系 统 。 为 了 实现 高 效 的 用 户 交 互 ,Windows 的 窗口 管理 和 图 形 功能 也 运 
行 在 核心 态 。 

3. 系统 调用 .中 断 和 陷阱 

处 理 器 通过 陷阱 机 制 捕获 当前 执行 线程 ,并 将 控制 转 到 某 一 特定 的 处 理 过 程 。 在 陷阱 
处 理 之 前 ,系统 会 记录 当前 运行 线程 的 核心 栈 , 以 便 处 理 完 后 返回 该 线程 继续 执行 。 

Windows 利用 系统 服务 陷阱 来 实现 用 户 程序 对 系统 服务 调用 , 当 用 户 线程 调用 系统 服 
务 时 会 触发 系统 服务 陷阱 ,并 将 服务 转 到 系统 服务 人 口 ,切换 到 核心 态 进行 执行 。 

Windows 利用 中 断 陷阱 机 制 来 管理 硬件 设备 。 通 过 设备 驱动 程序 设置 硬件 中 断 陷阱 ， 
当 进 行 I/O 请 求 时 ,系统 通过 硬件 中 断 处 理 完成 设 定 的 操作 。 操 作 系 统 内 核 还 通过 设置 软 
中 断 陷阱 来 进行 启动 线程 调度 、 超 时 处 理 、 进 行 非 同 步 的 I/O 操作 、 非 同步 调用 其 他 线程 的 
功能 等 。 

Windows 利用 意外 陷阱 机 制 来 管理 系统 的 出 错 状态 , 当 发 生意 外 处 理事 件 时 ,系统 会 
根据 意外 事件 的 条 件 转 到 特定 的 意外 处理 例 程 。 

4. 利用 对 象 来 共享 系统 资源 

Windows 操作 系统 服务 定义 了 各 种 系统 数据 结构 ,Windows 对 只 在 系统 服务 内 部 使 用 
的 数据 往往 用 简单 的 结构 数据 来 表示 ,以 便 提高 系统 效率 。 对 于 需要 被 用 户 态 程 序 访 问 的 
系统 数据 , Windows 都 是 用 对 象 来 表示 的 ,如 进程 .线程 .文件 和 事件 等 。 

对 象 的 特点 是 必须 通过 对 象 服务 来 访问 和 修改 对 象 封 装 的 数据 。 系 统 服务 在 为 用 户 态 
的 进程 提供 访问 接口 时 ,可 以 利用 对 象 的 数据 封装 有 效 地 防止 破坏 性 的 操作 。 在 用 户 态 的 
进程 访问 系统 对 象 时 ,往往 使 用 对 象 句柄 。 对 象 句柄 是 可 以 引用 对 象 的 间接 指针 (以 免 直接 
访问 系统 数据 结构 ) 。 我 们 在 下 面 讲 到 的 关于 进程 结构 时 ,会 遇 到 很 多 与 对 象 和 对 象 句柄 相 
关 的 概念 。 

在 严格 意义 上 ,Windows 不 是 一 个 面向 对 象 实现 的 操作 系统 ,大 部 分 操作 系统 的 代码 
是 使 用 C 语言 来 编写 的 ,但 Windows 操作 系统 在 系统 设计 上 采用 了 面向 对 象 的 一 些 思 想 ， 
这 样 有 利于 在 提高 系统 效率 的 同时 增强 系统 的 可 移植 性 。 

5. 本 地 过 程 调用 

本 地 过 程 调用 是 Windows 操作 系统 为 系统 服务 进程 间 进 行 高 速 消息 传递 设计 的 通信 
机 制 , 它 不 提供 用 户 态 的 调用 接口 。 调 用 的 双方 分 为 服务 进程 和 客户 进程 ,它们 通过 端口 对 
象 来 进行 通信 。 为 了 处 理 多 个 调用 请 求 , 调 用 首先 在 调用 队列 中 排队 , 当 接 受 请 求 后 ,会 生 
成 客户 通信 端口 和 服务 通信 端口 来 完成 通信 。 


7.2 Windows 进程 和 线程 


构建 Windows 的 系统 服务 和 所 有 的 应 用 程序 都 是 以 进程 的 形式 驻 留 在 内 存 中 的 ,由 处 
理 器 调度 执行 来 完成 设 定 的 计算 功能 。 每 一 个 进程 都 包含 一 个 或 多 个 线程 , Windows 处 理 
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髓 调度 的 对 象 是 线程 。 本 节 介 绍 Windows 进程 和 线程 的 结构 以 及 它们 之 间 的 关系 。 
7.2.1 Windows 的 进程 和 线程 的 定义 


一 个 Windows 进程 有 自己 独立 的 虚拟 地 址 空间 ,用 以 保护 私有 的 执行 代码 和 数据 不 被 

其 他 的 进程 破坏 。 每 个 进程 包含 一 个 或 多 个 线程 ,运行 在 一 个 进程 中 的 线程 可 以 创建 新 的 
线程 和 新 的 进程 。 

在 Windows 操作 系统 中 ,处 理 器 调度 的 对 象 是 线程 ， 人 行 提 供 资源 和 
上 下 文 环境 ,保证 所 属 的 线程 在 进程 的 虚拟 地 址 空间 范围 内 运 
一 个 Windows 进程 包含 以 下 信息 : 
唯一 的 进程 标识 。 
一 个 独立 的 虚拟 地 址 空间 。 
映射 到 进程 虚拟 地 址 空间 的 执行 代码 和 数据 。 
访问 各 种 系统 资源 的 对 象 句柄 列表 。 
安全 上 下 文 定 义 来 说 明 与 进程 相关 的 用 户 .安全 信息 和 访问 特权 设 定 。 

至 少 包含 一 个 可 执行 的 线程 。 
一 个 Windows 线程 包含 以 下 信息 : 
。 唯一 的 线程 标识 。 
。 CPU 寄存 器 的 状态 数据 ,用 以 表示 处 理 器 的 状态 。 
。 两 个 线程 栈 , 一 个 在 用 户 态 执行 时 使 用 , 另 一 个 用 在 核心 态 执行 时 使 用 。 
。 一 个 供 子 系 统 、 运 行 库 和 动态 链接 库 使 用 的 线程 本 地 存储 空间 。 


7.2.2 进程 和 线程 的 关联 


Windows 的 进程 和 线程 是 紧密 相关 的 ,系统 通过 创建 进程 来 为 线程 提供 必要 的 上 下 文 
环境 ,如 内 存 、 资 源 对 象 等 ,进程 以 执行 进程 块 的 形式 驻 留 在 内 存 中 。 系 统 通过 创建 线程 来 
运行 具体 的 程序 ,同时 提供 处 理 器 调度 所 需要 的 信息 ,线程 以 执行 线程 块 的 形式 驻 留 在 内 存 
中 。 一 个 运行 的 线程 可 以 在 同一 进程 中 创建 新 的 线程 来 运行 新 的 功能 ,也 可 以 通过 创建 新 
的 进程 来 启动 新 程序 的 运行 环境 。 

如 图 7. 1 所 示 , 构 成 进程 的 数据 由 分 别 驻 留 在 系统 地 址 空间 中 的 核心 进程 块 和 驻 留 在 
进程 地 址 空间 中 的 进程 环境 块 构成 ,类 似 地 ,构成 线程 的 数据 也 由 分 别 驻 留 在 系统 地 址 空间 
中 的 核心 线程 块 和 驻 留 在 进程 地 址 空间 中 的 线程 环境 块 构成 。 进 程 通过 核心 进程 块 中 指向 
核心 线程 块 的 指针 来 访问 该 进程 所 属 的 线程 ,还 通过 进程 环境 块 为 运行 在 用 户 态 的 服务 访 
问 进 程 提供 接口 。 同 样 ,线程 也 通过 驻 留 在 进程 地 址 空间 中 的 线程 环境 块 为 运行 在 用 户 态 
的 服务 访问 线程 提供 接口 。 

线程 通过 线程 环境 块 中 的 指针 指向 它 属于 的 进程 的 进程 环境 块 ,因此 线程 调度 器 可 以 

过 线程 访问 进程 环境 提供 的 上 下 文 信息 。 


7.2.3 Windows 进程 的 结构 


如 表 7.1 所 示 , Windows 将 表示 进程 的 数据 结构 统称 为 执行 进程 块 , 它 提供 了 操作 系 
统管 理 进程 所 需要 的 基本 信息 。 执 行进 程 块 包括 本 进程 和 父 进程 的 标识 、 进 程 使 用 系统 内 
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图 7.1 Windows 进程 和 线程 的 关联 


一 线程 环境 块 普 | 


一 一 | 执行 线程 块 


存 的 配额 .进程 管理 虚拟 内 存 的 信息 、 进 程 所 使 用 的 对 象 句 柄 .进程 访问 的 安全 性 描述 以 及 
供 Windows 子 系统 访问 的 进程 信息 等 。 执 行进 程 块 还 有 一 部 分 数据 被 称 为 核心 进程 块 , 它 
包含 了 Windows 内 核 调 度 所 属 线程 需要 的 基本 信息 ,如 时 间 片 .核心 栈 和 进程 基准 优先 级 
等 。 除 此 之 外 ,还 有 一 部 分 称 作 进 程 环境 块 的 数据 驻 留 在 进程 地 址 空间 中 ,提供 映像 调 人 
器 . 堆 管 理 器 和 其 他 运行 在 用 户 态 的 动态 链接 库 所 需要 的 进程 信息 ,如 程序 映像 的 基地 址 、 
用 户 栈 信 息 和 线程 的 局 部 存储 空间 。 

表 7.1 Windows 进程 的 数据 结构 


执行 进程 块 的 数据 项 功 能 
进程 标识 唯一 的 进程 标识 号 、 父 进程 标识 号 和 运行 的 镜像 文件 (Image) 名 称 
系统 资源 配额 对 该 进程 所 使 用 系统 内 存 池 以 及 分 页 文件 的 配额 限制 
虚拟 内 存 管理 用 来 描述 进程 的 哪些 虚拟 地 址 空间 已 被 占用 、 哪 些 空间 可 以 使 用 ,以 及 进 


程 虚拟 内 存 管 理 的 状态 信息 
工作 集 信息 该 进程 的 虚拟 地 址 空间 中 驻 留 在 物理 内 存 中 的 页 面 的 集合 
当 进 程 所 属 的 线程 出 现 意外 时 ,进程 管理 器 会 通过 本 地 过 程 调用 发 送 意 


和 
意外 本 地 过 程 调用 端口 | 外 信息 到 该 进程 ,通过 该 端口 接收 意外 信息 进行 相应 的 处 理 
cc 当 进 程 所 属 的 线程 触发 调试 事件 时 ,进程 管理 器 会 通过 本 地 过 程 调用 发 
调试 本 地 过 程 调用 端口 | 送 调 试 消息 到 该 进程 ,通过 该 端口 接收 调试 消息 进行 相应 的 处 理 

访问 安全 描述 访问 该 进程 的 安全 设置 

对 象 和 名 柄 表 指向 该 进程 的 所 有 对 象 句柄 


Windows 子 系统 进程 信息 | Windows 子 系统 调用 该 进程 所 需要 的 进程 信息 
包含 了 Windows 内 核 调 度 该 进程 的 所 属 线程 所 需要 的 基本 信息 ,如 分 配 


核心 进程 块 给 该 进程 的 处 理 器 时 间 、 时 间 片 大 小 、 核 心 栈 信息 、 进 程 基准 优先 级 以 及 
驻 留 在 进程 地 址 空间 中 ,提供 映像 调 入 器 . 堆 管 理 器 和 其 他 运行 在 用 户 态 
进程 环境 块 的 动态 链接 库 所 需要 的 进程 信息 ,如 程序 映像 的 基地 址 .用户 栈 信息 和 线 


程 的 局 部 存储 空间 


7.2.4 Windows 线程 的 结构 
如 表 7.2 所 示 ,在 Windows 将 表示 线程 的 数据 结构 统称 为 执行 线程 块 , 它 为 管理 线程 
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提供 了 线程 的 基本 信息 。 执 行 线程 块 包括 该 线程 所 属 的 进程 线程 创建 和 结束 的 时 间 ` 线 程 
运行 的 起 始 例 程 的 地 址 .线程 级 别 的 安全 控制 和 等 待 处理 的 W/O 请 求 包 列 表 等 。 其 中 一 部 
分 数据 被 称 作 核心 线程 块 , 用 来 存储 用 于 处 理 器 调度 线程 的 相关 信息 ,如 执行 时 间 、 优 先 级 
和 核心 栈 的 地 址 等 。 还 有 一 部 分 被 称 作 线程 环境 块 的 线程 数据 驻 留 在 进程 地 址 空间 中 , 它 
为 调 入 映像 和 动态 连接 库 提供 上 下 文 信息 。 

表 7.2 Windows 线程 的 数据 结构 


内 容 功 能 

线程 时 间 线程 创建 和 结束 时 间 

所 属 进程 标识 所 属 进 程 的 标识 

起 始 地 址 线程 起 始 例 程 的 地 址 

访问 安全 控制 线程 级 别 的 访问 安全 控制 信息 

局 部 过 程 调用 信息 | 线程 处 理 局 部 过 程 调用 的 消息 标识 以 及 处 理 消息 的 地 址 

IO 信息 等 待 处 理 的 7/O 请求 包 的 列表 
存储 系统 进行 线程 调度 和 同步 的 线程 信息 ,如 该 线程 的 可 用 执行 时 间 、 核 心 栈 的 

核心 线程 块 地 址 、 指 向 系统 服务 列表 的 指针 、 线 程 环境 块 的 指针 以 及 与 处 理 器 调度 相关 的 信 
息 ( 如 调度 优先 级 .时间 配额 和 空闲 处 理 例 程 
驻 留 在 进程 地 址 空间 ,存储 用 于 映像 调和 器 和 Windows 动态 链接 库 所 使 用 的 线 

线程 环境 块 程 上 下 文 信息 ,如 线程 的 唯一 标识 、 用 户 栈 的 地 址 以 及 指向 所 属 进程 的 进程 环 
境 块 


7.2.5 Windows 进程 和 线程 的 创建 


Windows 在 启动 操作 系统 时 ,会 创建 一 些 系 统 进程 和 线程 ,为 应 用 程序 的 运行 提供 支 
撑 平 台 。 应 用 程序 也 是 通过 创建 进程 和 线程 来 完成 设 定 的 功能 的 。 本 节 通 过 分 析 
Windows 创建 进程 和 线程 的 过 程 ,介绍 进程 和 线程 的 管理 机 制 。 

1. 进程 的 创建 过 程 

应 用 程序 是 通过 调用 相应 的 进程 创建 函数 来 创建 一 个 新 的 Windows 进程 的 ,最 常用 的 
进程 创建 函数 是 CreateProcess。 

创建 进程 的 过 程 是 由 3 个 部 分 配合 完成 的 : 创建 进程 的 系统 服务 、Windows 子 系统 和 
新 的 进程 。CreateProcess 通过 调用 相关 的 系统 服务 来 调和 需要 执行 的 映像 文件 并 创建 进 
程 和 初始 线程 对 象 ,并 通过 消息 通知 Windows 子 系 统 新 的 进程 和 线程 对 象 已 被 创建 。 
Windows 子 系统 在 安装 了 新 的 进程 和 线程 后 ,通知 进程 管理 器 执行 初始 线程 。 初 始 线程 将 
新 的 进程 初始 化 ,并 开始 执行 设 定 的 代码 。 

如 图 7. 2 所 示 ,Windows 通过 CreateProcess 了 艺 数 来 创建 进程 的 过 程 如 下 : 

(1) CreateProcess 通过 调用 进程 管理 服务 找到 执行 文件 的 映像 ,并 为 其 创建 区 域 
对 象 。 

(2) 创建 执行 进程 对 象 , 包 括 设置 执行 进程 块 ,初始 化 进程 的 地 址 空间 ,初始 化 核心 进 
程 块 和 进程 环境 块 。 

(3) 创建 初始 线程 ,包括 创建 执行 进程 块 , 设 置 线程 的 唯一 标识 和 创建 线程 环境 块 。 
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进程 创建 的 Windows 、 
系统 服务 子 系统 新 的 进程 
打开 进程 要 执行 的 映像 


文件 ， 并 为 它 创建 区 域 
对 象 


创建 执行 进程 对 象 ,初始 


化 进程 地 址 空间 ,创建 初 
始 线 程 ， 通 知 Windows [| 在 ndows 本 
子 系 统 系统 中 安装 创 
建 的 进程 和 线 
程 
i 
执行 初始 线程 | 进程 初始 化 
返回 调用 线程 开始 执行 进程 
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图 7.2 Windows 创建 进程 的 过 程 


(4) 通过 发 送 消息 通知 Windows 子 系统 新 的 进程 已 被 创建 , 子 系统 将 初始 线程 插入 进 
程 的 线程 列表 ,并 将 新 的 进程 加 入 子 系统 进程 列表 。 

(5) 将 控制 传 回 进 程 的 初始 线程 ,对 进程 进行 初始 化 。 

(6) 在 新 的 进程 和 线程 的 上 下 文 内 调 入 相应 的 动态 链接 库 , 开 始 执行 程序 。 

2. Windows 线程 的 创建 过 程 

应 用 程序 是 通过 调用 相应 的 线程 创建 函数 来 创建 一 个 新 的 Windows 线程 的 ,最 常用 的 
进程 创建 函数 是 CreateThread。 

CreateThread 通过 系统 服务 调用 将 创建 线程 的 请 求 传递 到 位 于 Windows 执行 体 中 的 
进程 管理 器 , 它 创建 线程 对 象 , 并 调用 相应 的 系统 服务 初始 化 核心 线程 块 。Windows 通过 
调用 CreateThread 创建 线程 的 过 程 如 下 : 

(1) 在 进程 的 地 址 空间 中 为 线程 创建 用 户 栈 , 并 初始 化 运行 上 下 文 环境 。 

(2) 初始 化 线程 的 线程 环境 块 。 

(3) 创建 执行 线程 对 象 。 

(4) 通知 Windows 子 系统 新 线程 已 被 创建 , 子 系统 将 新 线程 的 线程 ID 插入 到 相应 进 
程 的 线程 列表 中 。 

(5) 新 线程 的 句柄 和 标志 被 返回 到 调用 的 线程 。 

(6) 线程 进入 调度 队列 等 待 执行 。 


7.3 ”Windows 处 理 器 调度 机 制 


Windows 处 理 器 调度 的 粒度 为 线程 , Windows 为 每 一 个 线程 分 配 调 度 优 先 级 。 调 度 器 
根据 优先 级 采用 抢占 式 调 度 策 略 , 让 具有 最 高 优先 级 的 线程 首先 执行 。 每 一 个 线程 都 分 配 
了 以 时 间 配 额 (quantum ) 为 单位 的 执行 时 间 ,通过 改变 线程 的 状态 来 进行 线程 调度 。 
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7.3.1 调度 优先 级 


Windows 在 分 配 处 理 器 时 间 时 ,不 考虑 调度 对 象 属于 哪 一 个 具体 的 进程 ,不 同 进程 的 
线程 原则 上 具有 同样 的 调度 优先 级 ,优先 级 的 设 定 更 多 的 是 考虑 线程 要 求 完成 的 时 间 紧 
迫 性 。 

Windows 内 核 使 用 32 个 优先 级 别 来 表示 线程 要 求 执行 的 紧迫 性 ,用 0 一 31 的 数字 表 
示 。 按 照 优先 级 的 功能 不 同 ,它们 可 以 被 分 为 3 组 : 

。 16 个 实时 优先 级 别 (16 一 31) 

。 15 个 可 变 优先 级 (1 一 15) 

。 1 个 系统 优先 级 (0) ,为 内 存 页 清 零 线程 保留 

在 应 用 创建 线程 时 ,用 户 可 以 用 更 加 形象 的 优先 级 措 述 来 设置 优先 级 。 当 创建 进程 时 ， 
可 以 赋予 以 下 优先 级 别 : 实时 、 高 高 于 一 般 一 般 \ 低 于 一 般 和 空间 。 当 创建 线程 时 ,在 进 
程 的 优先 级 别 上 进一步 赋予 以 下 优先 级 别 : 尽量 实时 、 最 高 .高 于 一 般 、 一 般 、 低 于 一 般 、 最 
低 和 空闲 。 这 样 应 用 可 以 用 比较 形象 的 方式 来 设 及 定 线程 优先 级 , 它 和 系统 的 优先 级 别 对 应 
关系 如 图 7.3 所 示 。 


36 15 12 10 8 6 
35 14 11 9 了 5 
24 13 10 8 6 4 
23 12 9 7 5 3 
22 11 8 6 4 2 

实时 高 高 于 一 般 一 般 低 于 一 般 空闲 


图 7.3 应 用 优先 级 别 和 系统 的 优先 级 别 的 对 应 关系 


处 理 器 调度 时 参考 两 个 优先 级 设置 ,一 个 是 从 当前 线程 所 在 的 进程 的 基准 优先 级 , 另 一 
是 线程 的 优先 级 。 一 般 来 讲 , 应 用 线程 运行 在 可 变 优 先 级 别 (1 一 15) 的 范围 内 ,如 果 需 要 进入 
实时 优先 级 别 (16 一 31) 范 围 来 运行 ,必须 取得 更 高 的 调度 优先 级 特权 。Windows 操作 系统 只 
有 一 个 内 存 页 清 零 线程 , 它 具 有 最 高 的 调度 优先 级 别 (0) ,以 保证 系统 内 存 管理 的 效率 。 


7.3.2 线程 状态 


在 处 理 器 调度 线程 执行 的 过 程 中 ,通过 改变 线程 的 状态 对 多 个 线程 进行 有 效 的 管理 。 
图 7.4 表示 了 一 个 线程 在 处 理 器 调度 过 程 中 的 状态 变迁 。 
下 面 通过 表 7. 3 对 线程 状态 的 含义 作 进一步 的 说 明 。 


表 7.3 线程 状态 的 说 明 

状 态 含义 

这 表示 一 个 线程 已 经 准备 就 绪 , 等 待 运行 。 调 度 器 查找 线程 库 中 处 于 就 绪 状 态 的 线程 ,来 决 
ee 定 下 一 个 运行 的 线程 

表示 一 个 线程 已 经 被 选择 作为 下 一 个 运行 的 线程 ,如 果 条 件 满足 ,调度 器 会 将 上 下 文 环 境 
切换 到 该 线程 。 但 处 于 预备 状态 的 线程 也 可 能 会 被 转换 到 就 结 状态 继续 等 竺 


状态 含义 
当 调 度 器 将 上 下 文 环境 切换 到 一 个 进程 ,该 线程 就 处 于 运行 状态 。 当 分 配给 线程 的 时 间 
= 配额 用 完 ,或 有 更 高 优先 级 的 线程 抢占 CPU, 它 会 让 出 处 理 器 

等 待 当 一 个 线程 需要 等 待 必要 的 系统 资源 时 ,会 转 人 等 待 状态 ,直到 系统 资源 就 绪 

本 如 果 一 个 线程 已 经 准备 就 绪 , 但 运行 它 所 需要 的 核心 栈 暂 时 被 分 页 调度 到 磁盘 上 , 它 就 进 
和 入 过渡 状 态 ,等 待 核心 栈 调 入 内 存 

终止 当 一 个 线程 完成 执行 后 ,就 进入 了 终止 状态 ,对 象 管 理 器 释放 相应 的 执行 线程 块 资源 
已 初始 化 | 一 个 线程 刚 被 创建 时 的 内 部 状态 


图 7.4 Windows 线程 状态 转换 图 


7.3.3 线程 调度 机 制 


Windows 通过 调度 数据 库 来 为 每 一 个 优先 级 别 的 线程 维护 一 个 就 绪 等 待 队列 , 当 处 理 
器 需要 调 人 一 个 线程 运行 时 ,系统 会 从 调度 数据 库 中 找到 一 个 具有 最 高 优先 级 别 的 就 绪 线 
程 ,并 给 它 分 配 执行 时 间 。 如 果 等 待 队列 中 有 线程 比 正 在 运行 的 线程 的 优先 级 更 高 ,运行 的 
线程 就 会 保存 它 运行 的 上 下 文 环境 并 进入 就 绪 队 列 ,高 优先 级 的 线程 恢复 它 的 上 下 文 环境 ， 
并 进入 运行 状态 。 下 面 对 Windows 线程 调度 的 机 制 和 算法 作 详 细 的 说 明 。 

1. 调度 数据 库 

系统 中 同时 有 多 个 线程 存在 ,而 每 个 处 理 器 在 一 个 时 刻 只 能 运行 一 个 线程 , Windows 
用 调度 数据 库 记 录 处 于 就 绪 状 态 的 线程 ,以 便 在 确定 下 一 个 执行 的 线程 时 参考 。 

由 于 每 个 线程 的 优先 级 别 不 一 样 , 如 图 7. 5 所 示 , Windows 为 每 一 个 优先 级 维护 了 一 
个 线程 队列 。 调 度 器 找到 优先 级 最 高 的 线程 队列 ,从 队列 头 找到 下 一 个 运行 的 就 绪 线程 。 

2. 时 间 配 额 

当 一 个 线程 进入 运行 状态 时 , 它 获得 了 一 个 可 以 运行 的 时 间 配 额 。 线 程 在 核心 线程 块 
中 都 记录 了 当前 的 时 间 配 额 值 ,每 过 一 个 时 钟 周期 ,该 值 就 会 减 1, 当 该 值 变 为 零 时 ,表示 时 
间 配 额 已 经 用 完 。 

当 分 配给 该 线程 的 时 间 配 额 用 完 时 ,调度 器 会 查找 调度 数据 库 看 是 否 有 就 绪 的 线程 在 
等 待 执行 。 如 果 有 等 待 的 就 绪 线程 ,调度 器 会 将 正在 执行 的 线程 转 人 等 待 或 就 绪 状 态 , 调 人 
下 一 个 具有 最 高 优先 级 的 线程 进行 运行 。 如 果 调 度数 据 库 中 没有 等 待 运行 的 就 绪 线程 , 调 
度 器 就 再 分 配 一 个 时 间 片 让 该 线程 继续 运行 。 
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图 7.5 调度 数据 库 的 不 同 优 先 级 就 绪 线程 队列 


PC 版 的 Windows 操作 系统 和 服务 器 版 的 Windows 分 配给 线程 的 运行 时 间 片 的 长 短 
有 所 不 同 。PC 版 的 Windows 分 配 的 时 间 片 较 短 ,以 免 某 些 线程 占用 太 多 的 运行 时 间 ,影响 
用 户 与 计算 机 之 间 的 交互 。 服 务 器 版 的 Windows 分 配 的 时 间 片 较 长 ,可 以 给 后 台 线 程 更 多 
的 时 间 完 成 服务 请 求 ,避免 频繁 的 CPU 切换 。 

3. 调度 算法 

Windows 采用 基于 优先 级 的 抢占 式 调度 算法 ,在 一 个 具有 和 较 低 优先 级 别 的 线程 正在 运 
行 时 ,如 果 有 一 个 具有 较 高 优先 级 别 的 线程 进入 就 绪 等 待 队列 ,或 一 个 具有 和 较 高 优先 级 别 的 
线程 的 等 待 结束 时 ,就 可 以 抢占 处 理 器 优先 执行 。 为 了 不 让 被 抢先 的 线程 等 待 太 长 的 时 间 ， 
调度 顺 会 将 它 移 到 等 待 就 绪 队 列 的 队 头 。 

当 一 个 正在 运行 的 线程 需要 等 待 某 一 个 对 象 时 ,包括 事件 、 互 斥 的 状态 解锁 等 ,会 
地 让 出 处 理 咒 而 进入 等 待 状态 。 系 统 为 每 一 个 需要 等 待 的 对 象 维护 了 一 We， 
处 理 吕 的 线程 会 进入 从 尾 等待 ,不 在 启 嵌 妆 据 库 中 具有 最 部 检 先 级 的 续 程 和 被 分 本 执行 了 
间 ,并 开始 运行 。 

当 一 个 线程 的 时 间 配 额 用 完 时 ,如 果 等 待 队列 中 有 就 绪 线程 等 待 , 调 度 器 会 将 当前 线程 
移 到 就 绪 等 待 队 列 的 队 尾 ,而 为 具有 最 高 优先 级 的 线程 分 配 运行 时 间 ,并 开始 运行 。 

当 一 个 线程 完成 所 有 的 代码 运行 ,调度 器 会 将 它 的 状态 设 为 结束 。 系 统 会 将 它 从 所 属 
进程 的 线程 表 中 去 掉 , 并 释放 它 使 用 的 内 存 和 系统 资源 对 象 。 如 果 调 度数 据 库 中 没有 等 待 
运行 的 就 绪 线程 , Windows 会 调和 人 空闲 线程 。 

4. 上 下 文 切换 

处 理 器 调和 信和 调 出 一 个 线程 时 ,是 通过 切换 上 下 文 来 实现 的 。 当 系统 调 出 一 个 正在 运 
行 的 线程 时 ,需要 保存 的 线程 上 下 文 信息 为 运行 指令 指针 用户 栈 和 核心 栈 指针 以 及 线程 所 
在 进程 的 虚拟 地 址 空间 指针 。 线 程 的 核心 栈 用 来 完成 上 下 文 的 切换 ,调度 器 将 调 出 线程 的 
上 下 文 环境 信息 压 入 该 线程 的 核心 栈 ,并 将 栈 指针 保存 到 该 线程 的 核心 线程 块 中 。 

在 调和 一 个 线程 执行 时 ,核心 栈 指针 指向 调 入 线程 的 核心 栈 ,并 恢复 调和 线程 的 执行 上 
下 文 。 如 果 调 入 线程 所 在 的 进程 需要 改变 ,处 理 器 会 将 相关 的 地 址 寄存 器 设置 到 新 进程 的 
虚拟 地 址 空间 。 处 理 器 再 将 控制 转 到 调和 人 线程 的 运行 指令 指针 ,开始 运行 该 线程 。 


7.4 Windows 的 内 存 管理 


Windows 的 存储 管理 主要 包括 内 存 管 理 和 外 存 管理 ,本 节 主 要 讲述 Windows 内 存 管 
理 的 机 制 ,在 11 章 中 将 结合 文件 系统 介绍 Windows 的 外 存 管理 。 
» T7060. 语 


不 同 版 本 的 Windows 操作 系统 支持 的 最 大 物理 内 存 是 不 一 样 的 ,如 Windows XP 最 大 
支持 4GB 物理 内 存 , Windows Server 2003 最 大 可 以 支持 64GB 的 物理 内 存 , Windows 
Server 2008 最 大 可 以 支持 2TB 的 物理 内 存 。32 位 的 Windows 操作 系统 定义 了 大 小 为 
4GB 的 虚拟 内 存 空 间 ,以便 使 系统 服务 和 应 用 可 以 在 固定 大 小 的 内 存 视 图 上 操作 。 内 存 管 
理 器 将 虚拟 地 址 转换 到 实际 的 物理 内 存 地 址 ,如 果 需 要 访问 的 数据 不 在 物理 内 存 中 ,系统 通 
过 换 页 机 制 将 它 调 和 内存。 


7.4.1 内 存 管 理 器 


Windows 通过 内 存 管 理 器 来 管理 内 存 , 它 的 一 个 重要 功能 就 是 将 进程 的 虚拟 地 址 映射 
到 具体 的 物理 内 存 地 址 。 当 系统 可 用 的 物理 内 存 不 够 时 ,内 存 管理 器 会 将 一 部 分 驻 留 在 物 
理 内 存 中 的 数据 通过 分 页 机 制 调 出 到 磁盘 上 , 当 需 要 时 再 将 它 调 人 物理 内 存 。 一 般 的 计算 
机 实际 提供 的 物理 内 存 都 小 于 应 用 需要 的 内 存 , 因 此 ,进程 一 般 只 有 一 部 分 虚拟 地 址 空间 中 
的 数据 驻 留 在 物理 内 存 中 ,这 一 部 分 虚拟 地 址 空间 被 称 为 工作 集 。 

内 存 管理 器 是 Windows 执行 体 的 一 部 分 , 它 由 一 组 运行 在 核心 态 的 系统 服务 组 成 ,用 
来 分 配 、 释 放 和 管理 虚拟 内 存 。 它 还 包含 内 存 访问 出 错 陷阱 处 理 程序 ,用 来 处 理 内 存 访问 时 
出 现 的 出 错 事 件 。 


7.4.2 内 存 管理 的 机 制 


1. 页 

内 存 管 理 器 将 虚拟 内 存 空 间 划 分 成 固定 大 小 的 单元 一 一 页 (page)。 页 的 大 小 根据 具体 
的 计算 机 体系 结构 而 定 , 对 于 80x86 体系 结构 的 处 理 器 ,页 大 小 一 般 为 4KB。 

应 用 程序 一 般 希 望 申请 到 连续 的 虚拟 地 址 空间 ,内 存 管理 器 通过 预 留 机 制 来 实现 这 一 
功能 。 当 线程 申请 预 留 一 部 分 内 存 时 ,内 存 管理 器 对 相关 的 页 做 预 留 标记 ,但 在 使 用 之 前 ， 
并 没有 将 预 留 的 虚拟 地 址 空间 映射 到 实际 的 物理 内 存 空 间 。 这 样 可 以 减少 分 配 内 存 的 时 
间 ,在 需要 使 用 时 再 进行 地 址 映射 。 例 如 ,每 个 线程 的 用 户 态 栈 就 是 通过 预 留 机 制 来 申请 连 
续 的 虚拟 缓冲 区 (默认 的 大 小 为 1MB) 。 

2. 共享 内 存 

Windows 提供 了 在 进程 间 共享 内 存 的 机 制 ,共享 内 存 可 以 理解 为 同一 块 物 理 内 存在 不 
同 进程 空间 中 的 映射 。 如 图 7. 6 所 示 , 当 两 个 进程 用 到 同一 个 动态 链接 库 时 ,系统 只 将 它 调 
A 

如 果 共 享 内 存 是 只 读 的 ,那么 这 种 共享 就 不 会 对 共享 的 数据 产生 影响 。 但 当 共 享 内 存 
是 可 以 写 入 的 ,一 个 线程 对 共享 内 存 内 容 的 修改 会 影响 其 他 进程 的 数据 一 致 性 。Windows 
采用 “复制 后 写 和 人 ”的 方式 来 处 理 这 种 情况 。 

如 图 7.7 所 示 ,如 果 进 程 2 试图 对 共享 的 页 进行 写 人 时 ,内 存 管理 器 会 给 该 共享 页 重新 
分 配 男 一 个 物理 内 存 , 并 将 该 页 的 内 容 复 制 到 新 的 页 中 。 进 行 写 人 操作 的 进程 将 该 页 映射 
到 新 的 物理 内 存 中 ,并 完成 写 人 操作 ,而 且 该 页 面 成 为 进程 2 的 私有 页 。 

3. 堆 管 理 

一 般 来 讲 , 内 存 申请 是 以 页 为 单位 的 (4KB) 。 当 线程 需要 申请 较 小 的 内 存 块 时 ,如 果 按 
照 内 存 页 分 配 机 制 ,内存 管理 器 只 能 为 它 申 请 以 页 为 单位 的 内 存 块 , 会 造成 了 内 存 资源 的 浪 
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费 。 为 了 解决 这 一 问题 , Windows 使 用 堆 管 理 器 来 管理 小 的 内 存 分 配 。 对 于 32 位 的 
Windows 操作 系统 来 说 , 堆 管 理 器 的 内 存 分 配 粒度 可 以 小 到 8B。 

每 个 进程 都 有 一 个 进程 堆 , 在 进程 创建 时 系统 分 配 默认 大 小 为 1MB 的 空间 作为 进 
空间 。 在 分 配 的 内 存 大 于 默认 堆 的 大 小 时 ,系统 将 动态 增加 进程 堆 的 空间 。 

4. 系统 内 存 池 

正如 我 们 在 前 面 提 到 的 ,所 有 的 核心 态 系 统 服务 都 共享 同一 个 系统 地 址 空间 。 内 存 管 
理 器 利用 两 种 大 小 动态 改变 的 内 存 池 来 管理 核心 态 服 务 的 内 存 分 配 。 

在 系统 服务 中 ,有 一 部 分 的 程序 和 数据 需要 常 驻 内 存 , 以 保证 系统 的 效率 ,如 中 断 处 理 
程序 等 。 内 存 管理 器 用 不 分 页 的 内 存 池 来 为 这 些 服 务 分 配 内 存 , 这 部 分 内 存 不 会 被 调 出 到 
磁盘 上 。 

在 操作 系统 中 ,还 有 一 部 分 程序 和 数据 可 以 被 调 出 到 磁盘 上 ,如 设备 驱动 程序 等 ,以 便 
为 其 他 的 程序 和 数据 提供 物理 内 存 空间 。 内 存 管理 器 用 分 页 内 存 池 来 为 它们 分 配 内 存 , 在 
必要 时 这 部 分 内 存 会 被 系统 调 出 到 磁盘 上 。 

这 两 个 内 存 池 都 驻 留 在 系统 的 虚拟 地 址 空间 的 高 端 部 分 ,线程 需要 通过 在 核心 态 的 系 
统 调 用 来 访问 这 一 部 分 空间 。 


7.5 虚拟 地 址 空间 


Windows 通过 虚拟 地 址 空间 提供 了 一 个 内 存 的 逻辑 视图 ,在 虚拟 地 址 空间 连续 的 内 存 
在 物理 分 布 上 并 不 一 定 连续 。 应 用 程序 通过 内 存 管 理 器 将 虚拟 地 址 映射 到 实际 的 物理 内 存 
地 址 上 。 


7.5.1 虚拟 地 址 空间 布局 


32 位 Windows 操作 系统 的 虚拟 地 址 空间 大 小 为 4GB。 操 作 系统 将 低 端 的 一 半 虚 拟 地 
址 空间 (0x0000 0000 到 0x7FFF FFFF) 分 配 作 为 进程 的 私有 地 址 空间 ,而 将 高 端 一 半 的 虚 
拟 地 址 空间 (0x8000 0000 到 0xFFFF FFFF) 分 配给 操作 系统 内 核 作 为 系统 地 址 空间 。 
如 图 7.8 所 示 , 基 于 x86 体系 结构 的 Windows 的 虚拟 地 址 空间 可 以 分 为 几 个 主要 的 部 
分 。 从 0x0000 0000 到 0x7FFF FFFF 的 2GB 的 低 端 地 址 空间 为 进程 的 私有 空间 ,用 来 存 
储 进 程 的 应 用 代码 、 全 局 变量 和 线程 堆 等 数据 。 
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0x0000 0000 


进程 私有 地 址 空间 
(应 用 代码 、 全 局 变量 、 线 程 堆 ) 
0x8000 0000 
内 核 及 执行 体 、 硬 件 抽象 层 、 引 导 
驱动 
0xC000 0000 
进程 页 表 和 工作 集 
0xC080 0000 
OxFFFF FFFF 


图 7.8 32 位 Windows 的 虚拟 地 址 空间 布局 


高 端 一 半 的 虚拟 地 址 空间 (0x8000 ,0000 到 0xFFFF,FFFF) 为 系统 地 址 空间 。 在 系统 
空间 地 址 的 低 段 部 分 (0x8000 ,0000 到 0xBFFF,FFFF) 驻 留 了 系统 内 核 及 执行 体 、 硬 件 抽象 
层 . 引 导 驱 动 等 系统 服务 。 在 系统 地 址 空间 的 中 段 (0xC000,0000 到 0xC07F,FFFF) 驻 留 了 
描述 进程 内 存 使 用 情况 的 页 表 和 工作 集 等 信息 。 在 系统 地 址 空间 的 高 段 (0xC080,0000 到 
0xFFFF,FFFF) 用 于 系统 高 速 缓存 .系统 内 存 池 等 系统 资源 。 

表 7.4 列 出 了 32 位 Windows 操作 系统 的 虚拟 地 址 空间 的 详细 分 布 。 


表 7.4 基于 32 位 x86 体系 结构 的 Windows 的 虚拟 地 址 布局 


地 址 范围 功 能 
0x0000,0000~0x7FFF, FFFF 2GB | 进程 的 私有 地 址 空间 (程序 代码 、 全 局 变量 和 线程 栈 等 ) 
Ox8000,0000~0x9FFF,FFFF 512MB 系统 内 核 (NTLDR，HAL) 和 引导 驱动 
OxA000,0000~0xA2FF,FFFF 48MB 系统 映射 视图 或 会 话 空间 
OxA300,0000~0xA3FF,FFFF 16MB | 终端 服务 的 系统 映射 视图 
OxA400,0000~0xBFFF, FFFF 448MB 附加 系统 页 表 和 人 口 或 附加 系统 高 速 缓存 
OxC000,0000~0xC03F,FFFF 4MB 进程 页 表 
OxC040,0000~0xC07F, FFFF 4MB 工作 集 链表 
OxC080,0000~0xCOBF, FFFF 4MB | 未 使 用 
0xC0C0,0000~0xCOFF, FFFF 4MB 系统 工作 集 链 表 
0xC100,0000 一 0xEOFF ,FFFF 系统 高 速 缓存 
OxE100 ,0000~0xEAFF, FFFF 分 页 缓冲 池 
0xEB00 ,0000~0xFFBD, FFFF 系统 页 表 入 口 和 非 分 页 缓冲 池 


OxFFBE,0000~0xFFFF,FFFF 


故障 处 理 和 硬件 抽象 层 (HAL) 结 构 


7.5.2 虚拟 地 址 转换 


系统 服务 和 应 用 程序 是 通过 虚拟 地 址 来 操作 内 存 的 ,访问 之 前 需要 将 虚拟 地 址 喘 射 到 
实际 的 物理 内 存 地 址 ,内 存 管理 器 利用 页 表 来 进行 地 址 转换 。 页 表 存 储 在 系统 地 址 空间 中 ， 
每 个 虚拟 地 址 都 和 一 个 页 表 入 口 相 关 。 

如 图 7.9 所 示 ,内存 管理 器 将 虚拟 地 址 映射 到 物理 地 址 时 ,首先 通过 页 表 查 到 该 虚拟 地 
址 的 页 表 入 口 ,再 通过 页 表 入 口 查 到 该 地 址 对 应 的 物理 内 存 地 址 。 在 虚拟 地 址 空间 连续 的 
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内 存 , 它 们 所 对 应 的 物理 地 址 往往 是 不 连续 的 。 


虚拟 地 址 物理 内 存 
虚拟 页 1 
虚拟 页 2 站 
虚拟 页 3 
物理 页 1 
一 | 物理 页 2 
一 | 页 表 入 口 1 
| 页 表 入 
-| 页 表 入 D3 | 一 
页 表 


图 7.9 虚拟 地 址 转换 


为 了 将 虚拟 地 址 转换 成 以 页 为 单位 的 结构 ,Windows 将 一 个 32 位 的 虚拟 地 址 解释 为 3 
个 独立 的 部 分 : 页 目录 索引 (Page Directory Index) ,页 表 索 引 (Page Table Index) 和 字 节 索 
引 (Byte Index)。 如 图 7. 10 所 示 , 页 目录 索引 用 10 个 地 址 位 表示 ,用 于 定位 虚拟 地 址 所 对 
应 的 页 表 ; 页 表 索 引用 10 个 地 址 位 表示 ,用 于 定位 该 虚拟 地 址 对 应 的 页 表 入 口 ; 字 节 索引 用 
12 个 地 址 位 表示 ,用 于 确定 该 地 址 在 对 应 的 物理 页 上 的 具体 位 置 ( 因 为 页 面 大 小 为 4K, 刚 
好 用 12 个 地 址 位 表示 ) 。 
31 22 21 12 11 0 


| 页 目录 索引 页 表 索 引 字 节 索引 


图 7.10 虚拟 地 址 的 页 索引 结构 


我 们 用 图 7. 11 来 说 明 虚 拟 地 址 通过 页 目录 和 页 表 进 行 地 址 转换 的 过 程 。 


页 目录 索引 页 表 索 引 字 节 索引 
页 表 1 物理 页 1 
页 目录 入 口 页 表 i 
页 表 入 口 | 物理 页 7 
一 一 一 一 一 -| 物理 地 址 
页 目录 : : 
页 表 n 物理 页 m 


图 7.11 虚拟 地 址 转换 过 程 
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第 一 步 : 每 一 个 进程 都 对 应 一 个 页 目录 , 当 操作 系统 开始 执行 某 
当前 进程 所 对 应 的 页 目录 。 
第 二 步 : 一 个 进程 可 以 有 多 个 页 表 , 通 过 页 
地 址 所 对 应 的 页 表 。 

dd 

第 四 步 : 当 定 位 了 物理 页 框 号 后 ,通过 字 节 索引 可 以 正确 地 判断 虚拟 地 址 对 应 的 物理 
地 址 。 

一 个 进程 都 有 单一 页 目录 , 它 将 该 进程 所 有 的 页 表 都 映射 到 一 个 页 上 ,在 x86 体系 结 
构 的 Windows 中 它 有 固定 的 系统 虚拟 地 址 : 0xC030,0000。 页 表 由 一 组 页 表 入 口 构成 ,x86 
系统 的 页 表 索 引用 10 个 地 址 位 表示 ,因此 一 个 页 表 可 以 索引 1024 个 页 表 入 口 。 对 32 位 的 
Windows 来 说 ,需要 1024 个 页 表 来 映射 4GB 的 虚拟 地 址 空间 。 

如 图 7.12 所 示 ,一 个 页 表 入 口 不 仅 包含 了 虚拟 地 址 所 对 应 的 物理 页 框 号 ,而 且 包 含 了 
表示 该 内 存 页 状态 的 标志 ,这 些 标志 的 含义 在 表 7. 5 中 列 出 。 


31 12 “11 0 


一 进程 时 ,系统 会 设置 


目录 索引 ,内 存 管理 器 可 以 定位 相应 的 虚拟 


物理 页 框 号 页 的 状态 位 


图 7.12 页 表 入 口 的 结构 


表 7.5 描述 了 页 表 入 口 的 低 12 位 表示 的 页 的 主要 状态 位 及 其 含义 。 
表 7.5 页 表 中 的 状态 位 及 其 含义 


状态 位 含 :4 状态 位 含 义 
Accessed 该 页 是 否 已 被 读 过 Owner 该 页 是 否 可 以 在 用 户 态 下 访问 
Cached Disabled | 该 页 是 否 不 能 被 缓存 Valid 该 页 是 否 驻 留 在 物理 内 存 中 
Dirty 该 页 是 否 已 被 写 过 Write Through pip 
Global 该 转换 是 否 适用 于 所 有 的 进程 | Write 该 页 是 否 可 写 
Large Page 该 页 是 否 为 大 页 (4MB) 


为 需要 运行 的 数据 和 代码 让 出 空 


7.6 页 面 调度 


大 多 数 计算 机 系统 的 实际 可 用 物理 内 存 都 比 运行 应 用 所 需 的 内 存 要 小 ,在 物理 内 存 不 
够 的 情况 下 ,内 存 管理 器 需要 将 一 部 分 内 存 中 的 数据 通过 页 面 调度 机 制 置换 到 磁盘 上 ,以 便 


s 间 。 当 线程 访问 某 一 虚拟 地 址 的 数据 ,而 它 已 经 被 置换 到 


磁盘 上 时 ,虚拟 内 存 管理 器 就 会 将 这 一 部 分 内 容重 新 从 磁盘 上 调 回 到 内 存 中 。 


7.6.1 


缺 页 处 理 
当 虚 拟 地 址 对 应 的 页 表 入 口 的 标志 


:表明 当前 


不 能 马上 被 访问 时 ,系统 


会 判断 原因 并 
* 181 ， 


发 出 缺 页 错误 请 求 。 系 统 会 通过 陷阱 机 制 将 这 一 错误 转 到 内 存 管理 器 的 错误 处 理 程序 。 
表 7.6 说 明了 各 种 缺 页 错误 处 理 的 方式 。 
表 7.6 缺 页 处 理 的 各 种 情况 
缺 页 原 因 


被 访问 的 页 不 在 物理 内 存 中 ,而 在 磁盘 上 的 
页 文件 或 映射 文件 中 


该 页 被 挂 起 或 在 修改 页 列表 中 


处 理 方式 


分 配 一 个 物理 页 ,从 磁盘 上 读 入 该 页 ,并 将 它 记 入 工作 集 


将 该 页 转移 到 进程 或 系统 的 工作 集 


访问 预 留 页 或 超出 了 分 配 的 地 址 空间 访问 错误 
在 用 户 态 访问 只 能 在 核心 态 访问 的 页 访问 错误 
写 入 只 读 的 页 访问 错误 


复制 该 页 并 将 新 的 页 作为 进程 的 私有 页 ,同时 更 新 相应 
的 映射 和 工作 集 


访问 错误 


写 入 “复制 后 写 入 ”页 


执行 页 中 标明 不 能 被 执行 的 代码 


7.6.2 工作 集 及 页 面 调度 策略 


工作 集 是 驻 留 在 物理 内 存 中 的 虚拟 页 的 集合 ,工作 集 分 为 进程 工作 集 和 系统 工作 集 。 
进程 工作 集 用 来 描述 一 个 进程 中 的 所 有 线程 引用 的 驻 留 在 内 存 中 的 页 面 ,系统 工作 集 表示 
系统 空间 中 可 被 分 页 的 系统 代码 和 数据 驻 留 在 物理 内 存 中 的 部 分 。 

Windows 的 页 面 调 度 采 用 的 是 请 求 式 复 调度 策略 , 即 当 线程 产生 缺 页 错误 时 ,内 存 管 
理 器 如 果 判 断 该 页 不 在 物理 内 存 中 , 它 会 将 被 请 求 的 页 面 及 和 它 相 邻 的 一 些 页 面 调 人 内 存 。 
一 般 来 讲 ,按照 “集中 访问 ”, 程 序 , 特 别 是 大 型 的 程序 ,在 特定 的 时 间 里 仅 在 局 部 的 地 址 空间 
上 运行 。 根 据 这 一 原理 调 入 缺 页 相 邻 的 一 些 页 ,为 线程 随后 访问 它们 做 好 了 准备 ,大 大 减少 
了 线程 频繁 进行 缺 页 调度 的 几率 。 

当 缺 页 处 理 需 要 调 人 新 的 页 ,而 物理 内 存 全 部 被 占用 时 , Windows 采用 “最 久未 使 用 ” 
策略 来 决定 哪些 虚拟 页 需要 从 内 存 中 移出 去 。Windows 为 每 个 进程 的 工作 集 设 置 了 页 数 
限制 ,进程 初始 工作 集 大 小 为 50 个 页 面 ,可 以 通过 系统 调用 来 增加 ,但 最 大 的 工作 集 不 超过 
345 个 页 面 。 当 物理 内 存 不 够 且 该 进程 的 某 些 页 面 驻 留 时 间 最 长 ,或 该 进程 的 工作 集 达 到 
了 最 大 限制 时 ,系统 就 通过 换 页 机 制 将 这 些 页 置换 出 物理 内 存 。 


7.6.3 页 框 号 和 物理 内 存 管 理 


Windows 将 物理 内 存 按照 页 的 大 小 顺序 划分 成 同样 大 小 的 单元 , 称 之 为 页 框 (page 
frame) ,系统 用 页 框 号 数据 库 来 描述 整个 物理 内 存 的 状态 。 

页 框 号 数据 库 如 图 7. 13 所 示 , 它 描述 了 每 一 个 物理 内 存 页 的 状态 ,所 有 在 工作 集中 的 
页 面 都 标 上 了 "激活 ?状态 。 为 了 让 内 存 管 理 器 快速 地 查找 到 同一 状态 的 物理 页 ,页 框 号 数 
据 库 将 相同 状态 的 物理 页 通过 链表 的 形式 连接 在 一 起 。 

表 7.7 对 物理 页 的 各 种 状态 进行 了 说 明 。 
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一 一 空闲 


已 修改 

一 。 空间 一- 
只 读 | 
坏 页 一 一 ”| 已 修改 | 
物理 页 状态 物理 内 存 


图 7.13 页 框 号 数据 库 及 状态 链表 


表 7.7 物理 页 的 状态 及 其 说 明 
说 明 
该 页 属于 某 一 工作 集 ,或 者 属于 系统 的 常 驻 内 存 页 


这 是 一 个 临时 状态 标志 ,表明 该 页 既 不 属于 一 个 工作 集 也 不 在 分 页 列表 上 ,而 是 正在 被 处 理 
的 过 程 中 


该 页 被 从 一 个 工作 集中 移出 了 ,对 它 的 修改 已 经 写 人 到 磁盘 ,页 表 入 口 还 是 指向 该 物理 页 ， 
但 对 访问 设置 了 挂 起 标志 


该 页 被 从 一 个 工作 集中 移出 了 ,但 对 它 的 修改 还 没有 被 写 人 到 磁盘 ,页 表 入 口 还 是 指向 该 物 
理 页 ,完成 写 人 磁盘 后 才 可 以 投入 使 用 


该 页 没有 任何 被 修改 的 数据 ,但 还 没有 被 清 零 ,出 于 安全 性 的 考虑 还 不 能 被 用 户 进程 使 用 
该 页 已 经 被 清 零 ,能 被 用 户 进程 使 用 

该 页 位 于 只 读 内 存 

该 页 物理 损坏 ,不 能 被 使 用 


本 章 小 结 


Windows 操作 系统 有 很 多 版 本 ,其 中 Windows NT 代表 了 Windows 体系 结构 发 展 的 
主要 方向 。 本 章 在 介绍 Windows NT 体系 结构 的 特点 和 相关 概念 后 ,着重 介绍 了 Windows 
的 进程 管理 和 内 存 管理 机 制 。 

Windows 将 处 理 器 的 执行 模式 分 为 核心 态 和 用 户 态 ,操作 系统 的 内 核 服务 运行 于 核心 
态 ,而 应 用 程序 运行 于 用 户 态 。 用 户 态 的 进程 有 自己 独立 的 地 址 空间 ,而 核心 态 的 服务 和 驱 
动 程序 共享 同一 系统 地 址 空间 。 

本 章 详细 地 介绍 了 Windows 进程 和 线程 的 关系 。Windows 的 所 有 系统 服务 和 应 用 程 
序 都 是 以 进程 的 形式 驻 留 在 内 存 中 ,一 个 进程 可 以 有 一 个 或 多 个 线程 。 进 程 为 线程 的 运行 
提供 资源 和 上 下 文 环境 ,而 线程 通过 处 理 器 调度 来 完成 计算 的 功能 。Windows 以 执行 进程 
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块 的 形式 驻 留 在 内 存 中 ,而 线程 是 以 执行 线程 块 的 形式 驻 留 在 内 存 中 的 ,它们 之 间 相 互 关 
联 。 本 章 还 介绍 了 执行 进程 块 和 执行 线程 块 的 数据 结构 。 通 过 分 析 进 程 和 线程 的 创建 过 
程 ,本 章 介 绍 了 Windows 是 如 何 管理 进程 和 线程 的 。 

本 章 还 介绍 了 Windows 的 处 理 器 调度 机 制 , Windows 是 以 线程 为 调度 对 象 的 。 每 个 
线程 都 有 调度 优先 级 的 设 定 , 并 且 被 分 配 了 一 定 的 执行 时 间 片 。 调 度 器 通过 改变 现成 的 状 
态 来 实现 对 多 个 线程 的 调度 ,Windows 采用 基于 优先 级 的 抢占 式 调度 算法 。 

本 章 介绍 了 Windows 的 内 存 管理 机 制 ,Windows 通过 内 存 管理 器 来 管理 内 存 。32 位 
的 Windows 设计 了 大 小 为 4GB 的 虚拟 地 址 空间 。 其 中 低 端的 一 半 虚 拟 地 址 空间 被 分 配 作 
为 进程 的 私有 空间 ,高 端的 一 半 虚 拟 地 址 空间 被 分 配给 操作 系统 内 核 作 为 系统 地 址 空间 。 

本 章 还 介绍 了 系统 内 存 和 应 用 内 存 的 不 同 分 配方 式 , 系 统 服务 从 统一 的 系统 内 存 池 内 
分 配 内 存 ,而 应 用 程序 通过 应 用 进程 的 页 面 管理 和 堆 管 理 来 分 配 内 存 。 系 统 服 务 和 应 用 程 
序 是 通过 虚拟 地 址 来 操作 内 存 的 ,访问 之 前 需要 将 虚拟 地 址 映射 到 实际 的 物理 内 存 地 址 ,内 
存 管理 器 利用 页 表 来 进行 地 址 转换 。Windows 采用 请 求 式 复 调度 策略 来 进行 页 面 调度 ,并 
将 驻 留 在 物理 内 存 中 的 页 记 和 工作 集 。 


习题 


简 述 Windows 核心 态 和 用 户 态 的 区 别 。 

Windows 操作 系统 有 哪些 系统 服务 ? 简 述 它们 的 功能 。 

描述 Windows 的 进程 和 线程 的 概念 ,解释 它们 的 区 别 和 联系 。 

在 Windows 进程 结构 中 ,核心 进程 块 和 进程 环境 块 分 别 起 到 什么 作用 ? 

简 述 Windows 的 线程 结构 以 及 它 在 内 存 中 的 驻 留 机 制 。 

通过 Windows 任务 管理 器 观察 和 分 析 系 统 中 的 进程 。 

用 C 语 言 编 写 程序 利用 CreateProcess 和 CreateThread 函数 创建 一 个 Windows 进程 

和 两 个 线程 。 

7.8 哪些 系统 服务 参与 了 Windows 创建 进程 的 过 程 ? 它们 分 别 起 到 什么 作用 ? 

7.9 在 Windows 处 理 器 调度 的 过 程 中 ,线程 的 哪些 状态 可 以 转换 到 就 绪 状 态 ? 它们 在 什 
么 条 件 下 转换 到 该 状态 ? 

.10 简 述 32 位 的 Windows 操作 系统 的 虚拟 地 址 空间 的 布局 。 

11 简 述 虚拟 地 址 到 物理 内 存 地 址 的 转换 过 程 , 其 中 页 表 起 到 什么 作用 ? 

.12 简 述 工作 集 在 Windows 内 存 管理 中 的 作用 和 工作 过 程 。 
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第 8 章 文件 系统 


无 论 是 用 户 数据 ,还 是 计算 机 系统 程序 和 应 用 程序 ,都 要 以 一 定 的 形式 和 格式 进行 组 
织 ,保存 和 管理 。 如 何 安 全 有 效 地 快速 大 量 处 理 这 些 数 据 和 程序 ,就 成 为 操作 系统 的 重要 内 
容 。 文 件 系统 是 计算 机 组 织 ` 存 取 和 保存 信息 的 重要 手段 。 本 章 主要 讨论 文件 的 组 织 结构 、 
存 取 结 构 、 保 护 以 及 文件 系统 空间 管理 等 问题 。 


8.1 文件 系统 的 概念 
1. 文件 系统 的 引入 


操作 系统 对 计算 机 的 管理 包括 两 个 方面 : 硬件 资源 的 管理 和 软件 资源 的 管理 。 硬 件 资 
源 的 管理 包括 CPU 的 管理 ,存储 器 的 管理 和 设备 管理 等 ,主要 解决 硬件 资源 的 有 效 和 合理 


利用 问题 。 软 件 资源 的 管理 则 包括 对 各 种 系统 程序 CpU 

(包括 操作 系统 本 身 的 程序 )、 工具 软件 (例如 编辑 程 硬件 资源 存储 器 

序 ,编译 程序 等 ) 、 中 间 件 、 库 函数 及 各 种 用 户 程 序 和 数 , 设备 

据 的 管理 。 图 8. 1 给 出 了 资源 管理 的 分 类 图 。 计算 机 资源 系统 程序 
显然 ,用 户 使 用 计算 机 来 完成 自己 的 某 件 任 务 时 ， 软件 次 系统 应 用 程序 

砍 件 资源 4 库 函 数 

要 遇 到 下 列 问题 : 用 户 应 用 程序 


(1) 使 用 现 有 的 软件 资源 来 协助 完成 自己 的 任 
务 。 例 如 ,利用 编辑 、 编 译 及 链接 程序 来 生成 目标 代 图 8.1 操作 系统 的 软 硬 件 管理 
码 ; 利 用 系统 调用 库 葡 数 与 实用 程序 来 减少 编程 工作 ， 

避 开 与 硬件 有 关 的 部 分 等 。 

(2) 编制 完成 的 或 未 完成 的 程序 存放 在 什么 地 方 ,需要 访问 的 数据 存放 在 什么 地 方 ,从 
而 使 得 人 们 可 以 再 利用 已 有 的 软件 资源 。 

事实 上 ,这 两 个 问题 是 一 个 怎样 对 软件 资源 (程序 和 数据 ) 进 行 透明 地 快速 存 取 问题 。 
在 早期 的 计算 机 系统 中 ,由 于 硬件 资源 的 限制 ,只 能 用 卡片 或 纸 带 来 存放 程序 或 数据 。 这 些 
卡片 和 纸 带 都 分 别 编号 存放 , 当 用 户 需 要 使 用 它们 时 ,再 把 这 些 卡片 和 纸 带 放 在 读 卡 机 上 输 
入 计算 机 。 显 然 ,这 些 人 工 干预 的 控制 和 保存 软件 资源 的 方法 不 可 能 做 到 透明 存 取 ,不仅 限 
制 了 计算 机 的 处 理 能 力 和 CPU 等 计算 机 硬件 的 利用 率 ,而 且 不 方便 用 户 。 

大 容量 直接 存 取 的 磁盘 存储 器 以 及 顺序 存 取 的 磁带 存储 器 等 的 出 现 ,为 程序 和 数据 等 
软件 资源 的 透明 存 取 提 供 了 物质 基础 。 这 导致 了 对 软件 资源 管理 质 的 飞跃 一 一 文件 系统 的 
出 现 。 文 件 系 统 把 程序 和 数据 看 作文 件 , 并 把 它们 存放 在 磁带 或 磁盘 等 大 容量 存储 介质 上 ， 
从 而 做 到 对 程序 和 数据 的 透明 存 取 。 这 里 ,透明 存 取 是 指 不 必 了 解 文件 存放 的 物理 结构 和 
查找 方法 等 与 存 取 介质 有 关 的 部 分 ,只 需 给 定 一 个 代表 某 段 程序 或 数据 的 文件 名 ,文件 系统 
就 会 自动 地 完成 对 与 给 定 文件 名 相对 应 文件 的 有 关 操 作 。 

文件 系统 必须 完成 下 列 工 作 : 
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(1) 为 了 合理 地 存放 文件 ,必须 对 磁盘 等 辅助 存储 器 空间 (或 称 文件 空间 ) 进 行 统一 
理 。 Pe Ee 
储 区 。 

(2) 为 了 实现 按 名 存 取 ,需要 有 一 个 用 户 可 见 的 文件 逻辑 结构 ,用 户 按 照 文件 逻辑 结构 
所 给 定 的 方式 进行 信息 的 存 取 和 加 工 。 这 种 逻辑 结构 是 独立 于 物理 存储 设备 的 。 

(3) 为 了 便于 存放 和 加 工 信 息 ,文件 在 存储 设备 上 应 按 一 定 的 顺序 存放 。 这 种 存放 方 
式 被 称 为 文件 的 物理 结构 。 

(4) 完成 对 存放 在 存储 设备 上 的 文件 信息 的 查找 。 

(5) 完成 文件 的 共享 和 提供 保护 功能 。 

本 章 的 后 面 各 节 将 分 别 讨 论 这 些 问 题 。 

2. 文件 与 文件 系统 的 概念 

1) 文件 

上 面 已 经 说 过 ,文件 是 一 段 程序 或 数据 的 集合 。 这 是 一 种 较为 模糊 的 说 法 。 在 计算 机 
系统 中 ,文件 被 解释 为 一 组 赋 名 的 相关 联 字 符 流 的 集合 ,或 者 是 相关 联 记 录 ( 一 个 有 意义 的 
信息 单位 ) 的 集合 。 

文件 的 两 种 解释 定义 了 两 种 文件 形式 。 赋 名 的 字符 流 文 件 是 一 种 无 结构 文件 或 流 式 文 
件 。 目 前 常用 的 操作 系统 ,例如 Windows 和 Linux 等 均 采用 无 结构 文件 形式 。 无 结构 文件 
由 于 采用 字符 流 方式 ,与 源 程序 和 目标 代码 等 在 形式 上 是 一 致 的 ,因此 ,该 方式 适用 于 源 程 
序 和 目标 代码 等 文件 。 由 相关 联 记 录 组 成 的 文件 中 的 有 些 基 本 信息 单位 是 记录 。 记 录 是 由 
NCN>>1) 个 字 节 组 成 的 具有 特定 意义 的 信息 单位 。 记录 式 文件 主要 用 于 信息 管理 ,例如 数 
据 库 系 统 等 。 

在 有 些 操作 系统 中 ,从 字符 流 文件 的 角度 出 发 ,设备 也 被 看 作 是 赋予 特殊 文件 名 的 文 
件 。 从 而 ,系统 可 以 对 设备 和 文件 实施 统一 管理 ,大 大 简化 了 设备 管理 程序 和 文件 系统 的 接 
口 设计 。 

用 户 文件 名 由 用 户 给 定 , 它 是 一 个 字母 数字 串 ,有 些 系统 规定 必须 是 英文 字母 开头 且 允 
许 一 些 其 他 的 符号 出 现在 文件 名 的 非 开 头 部 分 。 

2) 文件 系统 

操作 系统 中 与 管理 文件 有 关 的 软件 和 数据 称 为 文件 系统 。 它 负责 为 用 户 建立 、 撤 销 、 读 
写 ,修改 和 复制 文件 ,还 负责 完成 对 文件 的 按 名 存 取 和 进行 存 取 控制 。 

文件 系统 具有 以 下 特点 : 

(1) 友好 的 用 户 接口 ,用 户 只 对 文件 进行 操作 ,而 不 管 文件 结构 和 存放 的 物理 位 置 。 

(2) 对 文件 按 名 存 取 ,对 用 户 透 明 。 

(3) 某 些 文件 可 以 被 多 个 用 户 或 进程 所 共享 。 

(4) 文件 系统 大 都 使 用 磁盘 、 磁 带 和 光盘 等 大 容量 存储 器 作为 存储 介质 ,因此 ,可 存储 
大 量 信息 。 

3. 文件 的 分 类 

在 文件 系统 中 ,为 了 有 效 方便 地 管理 文件 ,常常 把 文件 按 其 性 质 和 用 途 等 进行 分 类 。 

按 文件 的 性 质 和 用 途 可 以 分 为 3 类: 

1) 系统 文件 

该 类 文件 只 允许 用 户 通 过 系统 调用 来 执行 它们 ,而 不 允许 对 其 进行 读 写 和 修改 。 这 些 
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文件 主要 由 操作 系统 核心 和 各 种 系统 应 用 程序 和 数据 所 组 成 。 

2) 库 文件 

该 类 文件 允许 用 户 对 其 进行 读 取 和 执行 ,但 不 允许 对 其 进行 修改 。 库 文件 主要 由 各 种 
标准 子 程序 库 组 成 。 如 C 语言 子 程序 库 .FORTRAN 子 程序 库 等 。 

3) 用 户 文 件 

用 户 文件 是 用 户 委托 文件 系统 保存 的 文件 。 这 类 文件 只 由 文件 的 所 有 者 或 所 有 者 授权 
的 用 户 才能 使 用 。 用 户 文件 主要 由 源 程序 .目标 程序 和 用 户 数据 库 等 组 成 。 

另外 , 按 组 织 形式 ,文件 又 可 被 划分 为 以 下 3 类: 

1) 普通 文件 

普通 文件 既 包 括 系统 文件 ,也 包括 用 户 文件 、 库 函数 文件 和 实用 程序 文件 。 普 通 文件 主 
要 是 指 组 织 格式 为 系统 中 所 规定 的 最 一 般 格式 的 文件 ,例如 由 字符 流 组 成 的 文件 。 


2) 目录 文件 

目录 文件 是 由 文件 的 目录 信息 构成 的 特殊 文件 。 即 该 文件 的 内 容 不 是 各 种 程序 或 应 用 
数据 ,而 是 用 来 检索 普通 文件 的 目录 信息 。 

3) 特殊 文件 


在 UNIX 系统 中 ,所 有 的 输入 输出 设备 都 被 看 作 特 殊 文 件 。 这 组 特殊 文件 在 使 用 形式 
上 与 普通 文件 相同 ,如 查找 目录 、 存 取 操 作 等 。 但 是 ,特殊 文件 的 使 用 是 和 设备 处 理 程序 紧 
密 相连 的 。 系 统 必须 把 对 特殊 文件 的 操作 转 为 对 不 同 的 设备 的 操作 。 

除了 按 文件 的 用 途 和 组 织 形 式 来 分 类 外 ,还 可 以 按 文件 中 的 信息 流向 或 文件 的 保护 级 
别 等 分 类 。 例 如 , 按 信息 流向 可 把 文件 分 为 输入 文件 .输出 文件 以 及 输入 /输出 文件 等 。 按 
文件 的 保护 级 别 又 可 分 为 只 读 文件 , 读 写 文件 .可 执行 文件 和 不 保护 文件 等 。 

文件 的 分 类 主要 是 便于 系统 对 不 同 的 文件 进行 不 同 的 管理 ,从 而 提高 处 理 速度 和 起 到 
保护 与 共享 的 作用 。 例 如 ,一 个 系统 文件 在 读 和 内存 时 将 被 放 在 内 存 的 某 一 固定 区 且 享 受 
高 的 保护 级 别 , 从 而 不 必 像 一 般 的 用 户 文件 那样 只 有 在 内 存 用 户 可 用 区 分 得 相应 的 空闲 区 
之 后 才能 被 调和 内存。 


8.2 文件 的 逻辑 结构 与 存 取 方法 


8.2.1 逻辑 结构 


文件 的 逻辑 结构 是 用 户 可 见 结构 。 文 件 的 逻辑 结构 可 分 为 两 大 类 : 字符 流 式 的 无 结构 
文件 和 记录 式 的 有 结构 文件 。 在 设计 文件 系统 时 ,选择 何 种 逻辑 结构 才能 更 有 利于 用 户 对 
文件 信息 的 操作 呢 ? 一 般 情况 下 ,选取 文件 的 逻辑 结构 应 遵循 下 述 原则 : 

(1) 当 用 户 对 文件 信息 进行 修改 操作 时 ,给 定 的 逻辑 结构 应 能 尽量 减少 对 已 存储 好 的 
文件 信息 的 变动 。 

(2) 当 用 户 需要 对 文件 信息 进行 操作 时 ,给 定 的 逻辑 结构 应 使 文件 系统 在 尽 可 能 短 的 
时 间 内 查找 到 需要 查找 的 记录 或 基本 信息 单位 。 

(3) 应 使 文件 信息 占据 最 小 的 存储 空间 。 

(4) 应 便于 用 户 进行 操作 。 
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显然 ,对 于 字符 流 的 无 结构 文件 来 说 ,查找 文件 中 的 基本 信息 单位 ,例如 某 个 单词 ,是 比 
较 困难 的 。 但 反 过 来 ,字符 流 的 无 结构 文件 管理 简单 ,用 户 可 以 方便 地 对 其 进行 操作 。 所 
以 ,那些 对 基本 信息 单位 操作 不 多 的 文件 较 适 于 采用 字符 流 的 无 结构 方式 ,例如 源 程序 文 
件 、 目 标 代码 文件 等 。 

除了 字符 流 的 无 结构 方式 外 ,记录 式 的 有 结构 文件 可 把 文件 中 的 记录 按 各 种 不 同 的 方 
式 排列 ,构成 不 同 的 逻辑 结构 ,以 便 用 户 对 文件 中 的 记录 进行 修改 、 追 加、 查找 和 管理 等 
操作 。 

记录 是 一 个 具有 特定 意义 的 信息 单位 , 它 由 该 记录 在 文件 中 的 逻辑 地 址 (相对 位 置 ) 与 
记录 名 所 对 应 的 一 组 关键 字 、 属 性 及 其 属性 值 所 组 成 。 图 8. 2 是 一 个 记录 的 组 成 示例 。 


记录 名 R A 
1296: | 姓名 : A 
a 
逻辑 地 址 性 别 : 男 


出 生年 月 : 1971 年 9 月 
工资 ， 77 元 ee 
| > ed 
属性 属性 值 


图 8.2 记录 组 成 示例 


图 中 ,1296 是 名 为 R 的 记录 在 文件 中 的 迎 辑 地 址 ,姓名 : A” 是 该 记录 的 关键 字 , 而 “性 
别 ”“ 出 生年 月 ”“ 工 资 " 等 是 该 记录 的 属性 , 紧 跟 在 这 些 后 面 的 是 属性 值 。 一 个 记录 可 以 有 
多 个 关键 字 , 每 个 关键 字 可 对 应 于 多 项 属性 。 再 者 ,根据 各 系统 设计 的 要 求 不 一 样 , 记 录 既 
可 以 是 定 长 的 ,也 可 以 是 变 长 的 。 记 录 的 长 度 可 以 短 到 一 个 字符 ,也 可 以 长 到 一 个 文件 ,这 
要 由 系统 设计 人 员 确 定 。 

常用 的 记录 式 结构 文件 有 连续 结构 .多重 结构 . 转 置 结构 和 顺序 结构 。 

下 面 分 别 介绍 这 几 种 结构 。 

1. 连续 结构 

连续 结构 是 一 种 把 记录 按 生 成 的 先后 顺序 连续 排列 的 逻辑 结构 。 连 续 结构 的 特点 是 适用 
性 强 ,可 用 于 所 有 文件 (字符 流 式 的 无 结构 文件 实质 上 是 记录 长 度 为 一 个 字符 的 连续 结构 文 
件 ), 且 记录 的 排列 顺序 与 记录 的 内 容 无 关 。 这 有 利于 记录 的 追加 与 变更 。 但 是 ,连续 结构 文 
件 的 搜索 性 能 较 差 。 例 如 ,要 找 出 某 个 指定 关键 字 的 记录 时 ,系统 必须 对 文件 全 体 进 行 搜索 。 

2. 多 重 结构 

如 果 把 记录 按 关键 字 和 记录 名 排列 成 行列 式 结 构 , 则 一 个 包含 个 记录 名 wm(m 过 nn) 
个 关键 字 的 文件 构成 一 个 mx*n 维 行 列 式 ( 见 图 8. 3)。 其 RR 
中 ,如 果 第 i(1 志 i 各) 行 和 第 j(1 志 j 过 nn) 列 所 对 应 的 位 置 Re eT OY a DT 
上 为 1, 则 表示 关键 字 K; 在 记录 Ri; 中 ;反之 , 则 表示 关键 字 Ks |0, Oo 5 
K; 不 在 记录 RR; 中 。 另 外 ,同一 个 关键 字 也 可 以 同时 属于 | 
不 同 的 记录 。 这 生生 


显然 ,如 果 只 按 行列 式 结构 来 排列 记录 ,将 会 浪费 较 多 图 8.3 文件 的 记录 名 和 关键 字 
的 存储 空间 。 从 而 ,把 行列 式 中 那些 为 零 的 项 去 掉 , 并 以 关 构成 的 行列 式 
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键 字 K; 为 队 首 , 以 包含 关键 字 K; 的 记录 为 队列 元 素来 构成 一 个 记录 队列 。 对 于 一 个 有 m 
个 关键 字 的 队列 来 说 ,这 样 的 队列 有 mm 个 。 这 m 个 队列 构成 了 该 文件 的 多 重 结 构 (multi- 
list) ,如 图 8. 4 所 示 。 

3. 转 置 结构 

在 图 8.4 所 示 的 多 重 结构 中 ,每 个 队列 中 和 关键 字 直接 相连 的 只 有 一 个 记录 。 这 种 结 
构 虽 然 在 搜索 时 要 优 于 连续 结构 ,但 在 搜索 某 一 特定 记录 时 ,必须 在 找到 该 记录 所 对 应 的 关 
键 字 之 后 ,再 在 该 关键 字 所 对 应 的 队列 中 顺序 查找 。 与 此 相反 , 转 置 结构 (inverted file) 把 
含有 相同 关键 字 的 记录 指针 全 部 指向 该 关键 字 ,也 就 是 说 ,把 所 有 与 同一 关键 字 对 应 的 记录 
的 指针 连续 地 置 于 目录 中 该 关键 字 的 位 置 下 ( 见 图 8.5)。 转 置 结构 最 适用 于 给 定 关键 字 后 
的 记录 搜索 。 


Kl 
Nm | 
Ke RR R—.. 含有 KK 的 所 有 : 
| 记录 指针 上 RR 
及 - 
天 he | 一 R 一 及 = 及 ee : 
图 8.4 文件 的 多 重 结构 图 8.5 文件 的 转 置 结 构 


4. 顺序 结构 

如 果 系 统 要 求 按 某 种 优先 顺序 来 搜索 或 追加 、 删 除 记 录 , 则 最 好 采用 顺序 结构 。 如 果 给 
定 了 顺序 规定 (例如 按 字母 顺序 ) , 则 把 文件 中 的 关键 字 按 规定 的 顺序 排列 起 来 就 形成 了 顺 
序 结构 文件 。 例 如 ,把 《人民 日 报 》 上 登载 的 新 闻 按 年 月 日 为 关键 字 做 成 记录 放 人 文件 中 ,并 
以 时 间 先 后 顺序 组 成 文件 。 这 样 ,如 果 要 处 理 某 段 时 间 内 所 发 生 的 大 事 等 问题 就 会 变 得 非 
常 简 单 。 例 如 ,用户 想 了 解 两 伊 战 争 的 情况 , 则 只 要 把 1990 年 8 月 19 日 开始 的 两 个 月 内 的 
有 关 记 录 搜 索 到 就 行 了 。 


8.2.2 存 取 方 法 


用 户 通过 对 文件 的 存 取 来 完成 对 文件 的 修改 .追加 和 搜索 等 操作 。 文 件 的 存 取 是 要 找 
到 文件 内 容 所 在 的 逻辑 地 址 。 常 用 的 存 取 方法 有 3 种 : 

(1) 顺序 存 取 法 ; 

(2) 随机 存 取 法 (直接 存 取 法 ); 

(3) 按 关键 字 存 取 法 。 

顺序 存 取 是 按照 文件 的 逻辑 地 址 顺序 存 取 。 在 记录 式 文件 中 ,这 反映 为 按 记 录 的 排列 
顺序 来 存 取 ,例如 ,车 当前 读 取 的 记录 为 R;, 则 下 一 次 读 取 的 记录 被 自动 地 确定 为 R; 的 下 
一 个 相 邻 的 记录 RR;+; 。 在 无 结构 的 字符 流 文件 中 ,顺序 存 取 反映 当前 读 写 指针 的 变化 。 在 
存 取 完 一 段 信息 之 后 , 读 写 指针 自动 加 上 或 减 去 该 段 信息 长 度 , 以 便 指 出 下 一 次 存 取 时 的 
位 置 。 

随机 存 取 法 允许 用 户 根据 记录 的 编号 来 存 取 文件 的 任 一 记录 ,或 者 是 根据 存 取 命令 把 
读 写 指针 移 到 和 欲 读 写 处 来 读 写 。 

许多 操作 系统 采用 顺序 存 取 和 随机 存 取 两 种 方法 。 
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按 关键 字 存 取 是 一 种 用 在 复杂 文件 系统 ,特别 是 数据 库 管 理 系统 中 的 存 取 方 法 。 文 件 
的 存 取 是 根据 给 定 的 关键 字 或 记录 名 进行 的 。 按 关键 字 存 取 法 首先 搜索 到 要 进行 存 取 的 记 
录 的 逻辑 位 置 , 青 将 其 转换 到 相应 的 物理 地 址 后 进行 存 取 。 下 面 介 绍 按 关键 字 存 取 的 搜索 
方法 。 

对 文件 进行 搜索 的 目的 是 要 查找 出 特定 记录 所 对 应 的 逻辑 地 址 ,以 便 将 其 转换 为 相应 
的 物理 地 址 ,实现 对 文件 的 操作 。 

对 文件 的 搜索 包括 两 种 : 关键 字 的 搜索 和 记录 的 搜索 。 对 关键 字 的 搜索 是 在 用 户 给 定 
所 要 搜索 的 关键 字 和 记录 之 后 ,确定 该 关键 字 
在 文件 中 的 位 置 ; 而 记录 的 搜索 则 是 在 搜索 到 | 
所 要 查找 的 关键 字 之 后 ,在 含有 该 关键 字 的 所 
有 记录 中 查找 出 所 需要 的 记录 。 显 然 ,对 于 不 
同 的 逻辑 结构 的 文件 ,其 搜索 方法 和 搜索 效率 
都 是 不 一 样 的 。 对 指定 记录 R; 的 搜索 过 程 如 
图 8.6 所 示 。 

对 于 给 定 的 Ri, 首 先 ,系统 确定 R; 所 对 应 
关键 字 的 记录 队列 。 如 果 在 所 查找 的 文件 中 不 
存在 这 样 的 队列 , 则 搜索 算法 结束 返回 ,从 而 无 
法 搜索 到 R;。 如 果 找 到 R;, 则 返回 其 所 对 应 的 
逻辑 地 址 。 如 果 找 不 到 R;, 则 返回 无 法 找到 R， 


的 有 关 信 息 。 返回 Ri 的 逻辑 地 址 返回 空 
对 关键 字 或 记录 的 搜索 与 其 他 数据 搜索 问 
题 一 样 ,都 属于 表格 搜索 问题 (table lookup)。 图 8.6 记录 Ri 的 搜索 过 程 


有 许多 搜索 算法 用 来 解决 表格 搜索 问题 。 这 些 
算法 可 以 大 致 分 为 3 We search) 、 散 列 法 (hash coding) 和 二 分 搜 
索 法 (binary search algorithm)。 下 面 分 别 简 单 地 介绍 这 几 种 搜索 算法 。 

1. 线性 搜索 法 

线性 搜索 法 是 一 种 最 简单 .最 直观 的 搜索 方法 。 它 从 第 一 个 关键 字 或 记录 开始 ,依次 和 
所 要 搜索 的 关键 字 或 记录 相 比 较 ， i pl hee 线性 搜索 法 所 需要 的 搜索 
时 间 与 所 搜索 的 表格 大 小 的 1/2 成 正比 。 这 是 因为 找到 一 个 所 需要 的 记录 平均 要 和 表 中 登 
记 的 总 项 数 的 1/2 项 比较 后 才能 得 到 。 

线性 搜索 法 的 搜索 效率 较 低 ,在 文件 中 记录 个 数 较 多 时 不 宜 采 用 。 

2. 散 列 法 

散 列 搜索 法 被 广泛 用 于 现代 操作 系统 的 数据 查找 。 散 列 法 的 核心 思想 是 : 定义 一 个 散 
列 函 数 h(k) ,使 得 对 于 给 定 的 关键 字 , 散 列 函 数 h(k) 将 其 变换 为 & 所 对 应 的 逻辑 地 址 。 

在 使 用 散 列 函 数 进行 搜索 时 ,有 时 会 出 现 两 个 不 同 的 输入 值 变换 到 同一 地 址 的 问题 。 
即 对 于 ki! = 二 ,有 h(k1)= 二 h(ks) 二 A。 显 然 ,&! 和 ks 中, 至少 有 一 个 与 A 中 的 内 容 不 一 
致 , 也 就 是 说 ,由 散 列 变换 得 到 的 结果 并 不 是 所 要 搜索 的 关键 字 , 这 种 问题 称 为 散 列 冲突 。 
解决 散 列 冲突 的 方法 是 采用 多 次 散 列 探索 。 例 如 , 设 第 i 次 散 列 变换 的 结果 为 h;(k) ,i 三 2， 
3,…, 则 可 令 
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hi(k) = (hi(k) + di) (mod?) 

这 里 ,t 为 被 搜索 表格 长 度 ,d; 为 第 i 次 搜索 所 得 地 址 与 第 1 次 搜索 所 得 地 址 之 间 的 距 
离 。d; 的 取 值 方法 很 多 ,最 简单 的 方法 是 设 d; 为 i 的 线性 函数 , 即 d; 二 a x i(a 为 一 个 大 于 
零 的 常数 ) 。 这 种 方法 称 线 性 散 列 法 。 但 是 ,使 用 线性 散 列 法 并 不 能 完全 解决 散 列 冲突 问 
题 。 例 如 ,对 于 让 一) ,k= 二 1,2,… ,如 果 hi(ki) 二 hy (ks), 则 存在 hi 十 k(ki) 二 hj 十 k(ks)。 

解决 散 列 冲突 的 另 一 个 方法 是 生成 一 组 随机 数 {ni ,rs ,… ,7), 且 令 d; 二 7r;。 显 然 ,除了 
hh (ki) 二 hi (ks) 可 能 存在 之 外 ,hi;(k;) 二 有 十 k(ks) 的 可 能 性 很 小 ,不 过 ,使 用 随机 数 的 方法 需 
要 占用 一 定 的 存储 空间 来 生成 和 存放 随机 数组 。 

还 有 一 个 解决 散 列 冲 突 的 方法 是 采用 平方 散 列 函数 方法 , 即 令 

hi(k) = (Ai(CR) 十 cx(xzi))(modzt) 

这 里 ,t 是 一 个 表示 被 搜索 表格 长 度 的 素数 ,c 是 一 个 大 于 零 的 常数 。 可 以 证 明 , 对 于 7 全 1 
(mod 1 ,即使 有 万 (Ai ) 王 万 (Rs ) ,对 于 i1,2, ,一 1, 有 万 (A)! 二 hj 十 i(ks)。 

3. 二 分 搜索 法 

对 于 顺序 结构 排列 的 关键 字 或 记录 来 说 ,二 分 搜索 法 具有 和 较 高 的 搜索 效率 。 

设 关键 字 Ko ,Ki ,K,,…,K,(n 之 1) 按 关键 字 间 距 a 排列, 如果 K。 的 逻辑 位 置 为 a, 则 
有 K; 的 人 逻辑 位 置 为 ao 十 i x d。 二 分 搜索 法 首先 把 所 要 搜索 的 关键 字 与 队列 的 首尾 关键 字 
相 比 较 , 如 果 和 其 中 之 一 相等 , 则 返回 所 搜索 到 的 关键 字 的 逻辑 位 置 。 和 否则 ,再 与 队列 1/2 
处 的 关键 字 比 较 , 如 果 所 要 搜索 的 关键 字 正 好 等 于 该 关键 字 的 话 , 则 返回 该 关键 字 的 逻辑 地 
址 。 和 否则 ,如果 所 要 搜索 的 关键 字 K 小 于 位 于 队列 中 央 的 关键 字 的 话 , 则 继续 搜索 左边 的 
半 个 队列 ;如 果 所 要 搜索 的 关键 字 天 大 于 位 于 队列 中 央 的 关键 字 的 话 , 则 继续 搜索 右边 的 
半 个 队列 。 这 样 ,每 次 用 以 中 央 关 键 字 划 分 的 部 分 组 成 新 的 队列 反复 进行 上 述 搜索 操作 , 直 
到 找到 为 止 。 这 一 搜索 过 程 如 图 8. 7 所 示 。 


ko kl La a k ki 
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图 8.7 二 分 搜索 法 的 搜索 过 程 


二 分 搜索 法 的 好 处 是 搜索 效率 高 。 与 线性 搜索 法 相 比 , 当 n( 表 长 ) 二 16 时 , 它 比 线性 搜 
索 法 约 快 2 倍 ; 当 z 一 1024 时 ,其 平均 搜索 速度 要 快 50 倍 。 不 过 ,二 分 搜索 法 需要 事先 把 搜 
索 对 象 按 一 定 顺序 排列 。 


8.3 文件 的 物理 结构 与 存储 设备 
上 节 介 绍 了 文件 的 逻辑 结构 和 存 取 方法 。 用 户 对 不 同 种 类 的 文件 采用 不 同 的 存 取 方 


法 ,以 方便 地 对 文件 进行 各 种 操作 。 无 论 是 哪 一 种 存 取 方法 ,都 是 首先 搜索 到 操作 对 象 一 一 
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记录 或 某 段 字 符 流 信息 的 逻辑 地 址 ,然后 ,由 逻辑 地 址 映射 到 对 应 的 物理 地 址 ,再 对 物理 地 
址 的 有 关 信 息 进 行 操作 。 由 逻辑 地 址 到 物理 地 址 的 映射 是 和 文件 的 存储 方式 也 就 是 文件 的 
物理 结构 紧密 相关 的 。 另 外 ,文件 系统 采用 哪 种 存 取 方法 和 逻辑 结构 ,实际 上 是 和 物理 存储 
介质 有 关 的 。 因 此 ,本 节 介 绍 文件 的 物理 结构 ,同时 也 介绍 常用 的 文件 存储 设备 。 


8.3.1 文件 的 物理 结构 


在 文件 系统 中 ,文件 的 存储 设备 通常 划分 为 若干 个 大 小 相等 的 物理 块 ,每 块 长 为 512B 
或 1024B。 与 此 相对 应 ,为 了 有 效 地 利用 存储 设备 和 便于 系统 管理 ,一 般 把 文件 信息 也 划分 
为 与 物理 存储 设备 的 物理 块 大 小 相等 的 逻辑 块 。 从 而 ,以 块 作为 分 配 和 传送 信息 的 基本 单 
位 。 显 然 ,对 于 字符 流 的 无 结构 文件 来 说 ,每 一 个 物理 块 中 存放 长 度 相等 的 文件 信息 (存储 
文件 尾部 信息 的 物理 块 除外 ) 。 但 是 ,对 于 记录 式 文件 来 说 ,由 于 记录 长 度 既 可 以 是 固定 的 ， 
也 可 以 是 可 变 的 ,而 且 其 长 度 不 一 定 刚 好 等 于 其 物理 块 的 长 度 ,从 而 给 由 记录 的 人 逻辑 地 址 到 
物理 地 址 的 变换 带 来 了 额外 的 负担 。 这 里 ,为 了 简单 起 见 ,假设 文件 系统 中 每 个 记录 的 长 度 
是 固定 的 , 且 其 长 度 正好 等 于 物理 块 的 长 度 。 从 而 ,对 于 记录 式 文件 来 说 ,利用 上 节 讨 论 的 
搜索 算法 得 到 的 逻辑 地 址 正好 与 文件 的 逻辑 块 号 一 一 对 应 ,这 就 简化 了 所 讨论 问题 的 条 件 。 

文件 的 物理 结构 是 指 文件 在 存储 设备 上 的 存放 方法 。 事实 上 ,由 于 文件 的 物理 结构 决 
定 了 文件 信息 在 存储 设备 上 的 存储 位 置 ,因此 ,文件 信息 的 迎 辑 块 号 (人 逻辑 地 址 ) 到 物理 块 号 
(物理 地 址 ) 的 变换 也 是 由 文件 的 物理 结构 决定 的 。 

常用 的 文件 物理 结构 如 下 。 

1. 连续 文件 

连续 文件 是 一 种 最 简单 的 物理 文件 结构 , 它 把 一 个 在 逻辑 上 连续 的 文件 信息 依次 存放 
到 物理 块 中 。 图 8. 8 给 出 了 连续 文件 结构 的 图 形 说 明 。 在 图 8. 8 中 ,一 个 逻辑 块 号 为 0、1、 
2、3 的 文件 依次 存放 在 物理 块 10、11、12、13 中 。 


文件 说 明 信 息 


第 一 物理 块 号 (10) 物理 存储 设备 
文件 长 度 (4) ”| 物理 块 号 | 10 | 11 [12 113| 
浸 辑 块 号 0 1 2 3 


图 8.8 连续 文件 结构 


连续 文件 结构 的 优点 是 一 旦 知道 了 文件 在 文件 存储 设备 上 的 起 址 和 文件 长 度 , 就 能 很 
快 地 进行 物理 存 取 。 这 是 因为 文件 的 逻辑 块 号 到 物理 块 号 的 变换 可 以 非常 简单 地 完成 。 但 
是 连续 文件 结构 在 建立 文件 时 必须 在 文件 说 明 信 息 中 确定 文件 信息 长 度 , 且 以 后 不 能 动态 
增长 。 而 且 在 文件 进行 某 些 部 分 的 删除 后 ,又 会 留 下 无 法 使 用 的 零头 空间 。 因 此 ,连续 文件 
结构 不 宜 用 来 存放 用 户 文件 .数据库 文件 等 经 常 被 修改 的 文件 。 

2. 串联 文件 

克服 连续 文件 的 缺点 的 办 法 之 一 是 采用 串联 文件 结构 。 串 联 文 件 结构 用 非 连续 的 物理 
块 来 存放 文件 信息 。 这 些 非 连续 的 物理 块 之 间 没 有 顺序 关系 ,其 中 每 个 物理 块 设 有 一 个 指 
针 , 指 向 其 后 续 连 接 的 另 一 个 物理 块 ,从 而 使 得 存放 同一 文件 的 物理 块 链 接 成 一 个 串联 队 
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列 。 图 8.9 给 出 了 串联 文件 的 物理 结构 。 


文件 说 明 信 息 
| 
物理 块 号 | 20 到 15 I/ 22 25 
连接 指针 |_15 22 25 0 


第 一 物理 块 号 20 
逻辑 块 号 0 1 2 3 


图 8.9 串联 文件 结构 


显然 ,使 用 串联 文件 结构 时 ,不 必 在 文件 说 明 信 息 中 指明 文件 的 长 度 ,只 需 指明 该 文件 
的 第 一 个 块 号 就 行 了 。 串 联 文件 结构 的 另 一 个 特点 是 文件 长 度 可 以 动态 地 增长 ,只 要 调整 
连接 指针 就 可 在 任何 一 个 信息 块 之 间 插入 或 删除 一 个 信息 块 。 

采用 串联 文件 结构 时 ,逻辑 块 到 物理 块 的 转换 由 系统 沿 串 联 队列 查找 与 逮 辑 块 号 对 应 
的 物理 块 号 的 办 法 完成 。 例 如 ,在 图 8.9 所 示 的 文件 结构 中 ,如 果 用 户 所 要 进行 操作 的 逻辑 
块 号 为 2, 则 系统 从 第 一 个 物理 块 20 开始 ,一 直 沿 串联 队列 搜索 到 队列 中 旭 辑 块 号 为 2 的 
第 三 块 时 ,得 到 其 所 对 应 的 物理 块 号 为 22。 

由 于 串联 文件 结构 只 能 按 队列 中 的 串联 指针 顺序 搜索 ,因此 ,串联 文件 结构 的 搜索 效率 
较 低 。 串 联 文件 结构 一 般 只 适用 于 逻辑 上 连续 的 文件 , 且 存 取 方法 应 该 是 顺序 存 取 的 。 理 
则 ,为 了 读 取 某 个 信息 块 而 造成 的 磁头 大 幅度 移动 将 花 去 较 多 的 时 间 。 因 此 ,串联 文件 结构 
不 适宜 随机 存 取 。 

3. 索引 文件 

第 三 种 文件 物理 结构 是 索引 结构 。 索 引 结构 要 求 系统 为 每 个 文件 建立 一 张 索引 表 , 表 
中 指出 文件 信息 所 在 的 多 辑 块 号 和 与 之 对 应 的 。 文件 说 明 信 息 


物理 块 号 。 索引 表 的 物理 地 址 则 由 文件 说 明 信 [和 插 儿 二 -| 和 

息 项 给 出 。 索 引文 件 结构 如 图 8. 10 所 示 。 [| .| 块 号 | 块 续 | J 20 
索引 文件 结构 既 可 以 满足 文件 动态 增长 的 iE 

要 求 ,又 可 以 较为 方便 和 迅速 地 实现 随机 存 取 。 2 | 22 | ~| 22 

因为 有 关 让 辑 块 号 和 物理 块 号 的 信息 全 部 放 在 EE 

一 个 集中 的 索引 表 中 ,而 不 是 像 串 联 文件 结构 那 国 入 六 ， 来 引 交 村 病 机 

样 分 散在 各 个 物理 块 中 。 


在 很 多 情况 下 ,有 的 文件 很 大 ,文件 索引 表 也 就 较 大 。 如 果 索 引 表 的 大 小 超过 了 一 个 物 
理 块 ,那么 我 们 必须 像 处 理 其 他 文件 的 存放 那样 决定 索引 表 的 物理 存放 方式 ,但 这 不 利于 索 
引 表 的 动态 增加 ;索引 表 也 可 按 串联 方式 存放 ,但 这 却 增 加 了 存放 索引 表 的 时 间 开 销 。 一 种 
较 好 的 解决 办 法 是 采用 间接 索引 (多 重 索 引 ) ,也 就 是 在 索引 表 所 指 的 物理 块 中 存放 的 不 是 
文件 信息 ,而 是 装 有 这 些 信 息 的 物理 块 地 址 。 这 样 , 如 果 一 个 物理 块 可 装 下 个 物理 块 地 址 
的 话 , 则 经 过 一 级 间接 索引 ,可 寻 址 的 文件 长 度 将 变 为 nxn 块 。 如 果 文件 长 度 还 大 于 nxn 
块 的 话 ,还 可 以 进行 类 似 的 扩充 , 即 二 级 间接 索引 。 其 原理 如 图 8. 11 所 示 。 

不 过 ,大 多 数 文件 不 需要 进行 多 重 索引 ,也 就 是 说 ,这 些 文件 所 占用 的 物理 块 号 可 以 放 
在 一 个 物理 块 内 。 如 果 对 这 些 文件 也 采用 多 重 索 引 , 则 显然 会 降低 文件 的 存 取 速 度 。 因 此 ， 
在 实际 系统 中 ,总 是 把 索引 表 的 头 几 项 设计 成 直接 寻 址 方式 ,也 就 是 这 几 项 所 指 的 物理 块 中 
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图 8.11 多 重 索 引 结构 


存放 的 是 文件 信息 ;而 索引 表 的 后 几 项 设计 成 多 重 索 引 , 也 就 是 间接 寻 址 方式 。 在 文件 较 短 
时 ,就 可 利用 直接 寻 址 方式 找到 物理 块 号 而 节省 存 取 时 间 。 

索引 结构 既 适 用 于 顺序 存 取 , 也 适用 于 随机 存 取 。 索 引 结构 的 缺点 是 由 于 使 用 了 索引 
表 而 增加 了 存储 空间 的 开销 。 另 外 ,在 存 取 文 件 时 需要 至 少 访问 存储 器 两 次 以 上 。 其 中 ,一 
次 是 访问 索引 表 , 另 一 次 是 根据 索引 表 提 供 的 物理 块 号 访问 文件 信息 。 由 于 文件 在 存储 设 
备 的 访问 速度 较 慢 ,因此 ,如 果 把 索引 表 放 在 存储 设备 上 ,势必 大 大 降低 文件 的 存 取 速 度 。 
一 种 改进 的 方法 是 , 当 对 某 个 文件 进行 操作 之 前 ,系统 预先 把 索引 表 放 入 内 存 。 这 样 ,文件 
的 存 取 就 可 直接 在 内 存 通 过 索引 表 确 定 物理 地 址 块 号 ,而 访问 磁盘 的 动作 只 需要 一 次 。 


8.3.2 文件 存储 设备 


存储 设备 有 磁盘 .光盘 和 磁带 等 。 其 中 磁盘 又 可 分 为 硬盘 和 软盘 。 近 年 来 ,软盘 已 逐步 
消失 ,取而代之 的 是 光盘 和 优盘 。 由 于 存储 设备 的 特性 决定 了 文件 的 存 取 方 法 ,因此 ,这 里 
介绍 以 磁带 为 代表 的 顺序 存 取 存储 设备 和 以 磁盘 为 代表 的 直接 存 取 存储 设备 的 特性 及 有 关 
存 取 方法 。 

1. 顺序 存 取 存储 设备 

磁带 是 一 种 最 典型 的 顺序 存 取 存储 设备 。 顺 序 存 取 存储 设备 只 有 在 前 面 的 物理 块 被 存 
取 过 之 后 ,才能 存 取 后 续 的 物理 块 的 内 容 。 而 且 , 为 了 在 存 取 一 个 物理 块 时 让 磁带 机 提前 加 
速 和 不 停止 在 下 一 个 物理 块 的 位 置 上 ,磁带 的 两 个 相 邻 的 物理 块 之 间 设 计 有 一 个 间隙 将 它 
们 隔 开 ( 见 图 8. 12)。 

磁带 
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图 8.12 磁带 的 结构 
磁带 设备 的 存 取 速度 或 数据 传输 率 与 下 列 因 素 有 关 : 
(1) 信息 密度 (字符 数 /英寸 ); 

(2) 磁带 带 速 (英寸 / 秒 ); 
(3) 块 间 间 际 。 
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如 果 带 速 高 ,信息 密度 大 , 且 所 需 块 间隙 (磁头 启动 和 停止 时 间 ) 小 的 话 , 则 磁带 存 取 速 
度 和 数据 传输 率 高 ,反之 则 磁带 存 取 速度 和 数据 传输 率 低 。 

另外 ,由 磁带 的 读 写 方式 可 知 ,只 有 当 第 i 块 被 存 取 之 后 ,才能 对 第 i 十 1 块 进行 存 取 操 
作 。 因 此 , 某 个 特定 记录 或 物理 块 的 存 取 访问 与 该 物理 块 到 磁头 当前 位 置 的 距离 有 很 大 关 
系 。 如 果 相 距 甚 远 , 则 要 花费 很 长 的 存 取 时 间 来 移动 磁头 。 因 此 ,如 果 按 随机 方式 或 按 关键 
字 存 取 方 式 存 取 磁 带 上 的 文件 信息 的 话 , 其 效率 不 会 很 高 。 但 是 ,磁带 设备 具有 容量 大 、 顺 
序 存 取 方 式 时 存 取 速 度 高 等 优点 。 因 此 ,磁带 设备 获得 了 较为 广泛 的 应 用 。 

2. 直接 存 取 存 储 设备 

磁盘 是 最 典型 的 直接 存 取 存储 设备 。 磁 盘 设 备 允 许 文 件 系 统 直接 存 取 磁盘 上 的 任意 物 
理 块 。 为 了 存 取 一 个 特定 的 物理 块 ,磁头 将 直接 移动 到 所 要 求 的 位 置 上 ,而 不 需要 像 顺序 存 
取 那 样 事先 存 取 其 他 的 物理 块 。 

磁盘 机 种 类 很 多 ,但 一 般 由 一 些 磁盘 片 组 成 的 磁盘 组 组 成 。 其 中 每 个 磁盘 片 对 应 一 个 
装 有 读 / 写 磁头 的 磁头 臂 , 磁 头 辟 上 的 两 个 读 / 写 磁头 分 别 对 磁盘 片 的 上 下 两 面 进行 读 写 。 
系统 在 对 磁盘 进行 初始 化 处 理 时 ,把 每 个 磁盘 片 分 割 成 一 些 大 小 相等 的 扇 区 。 在 磁盘 转动 
时 经 过 读 / 写 磁头 所 形成 的 圆 形 轨迹 称 为 磁道 。 由 于 磁头 臂 可 沿 半径 方向 移动 ,因此 ,磁盘 
上 有 多 条 磁道 。 另 外 ,人 们 通常 把 所 有 磁盘 片 的 相同 磁道 称 为 一 个 柱 面 ,因此 ,磁盘 上 每 个 
物理 块 的 位 置 可 用 柱 面 号 、 磁 头号 和 扁 区 号 表示 ,这 些 地 址 和 物理 块 号 一 一 对 应 。 人 磁盘 的 结 
构 如 图 8. 13 所 示 。 


全 柱 面 


图 8.13 磁盘 的 结构 


有 关 存 储 设备 ,特别 是 硬盘 存储 设备 的 进一步 信息 ,读者 可 从 网 站 www. storage. com 
上 了 解 。 


8.4 文件 存储 空间 管理 


存储 空间 管理 是 文件 系统 的 重要 任务 之 一 。 只 有 有 效 地 进行 存储 空间 管理 ,才能 保证 
多 个 用 户 共 享 文件 存储 设备 和 得 以 实现 文件 的 按 名 存 取 。 由 于 文件 存储 设备 是 分 成 若干 个 
大 小 相等 的 物理 块 , 并 以 块 为 单位 来 交换 信息 的 ,因此 ,文件 存储 空间 的 管理 实质 上 是 一 个 
空闲 块 的 组 织 和 管理 问题 , 它 包 括 空闲 块 的 组 织 ` 空 闲 块 的 分 配 与 空闲 块 的 回收 等 几 个 
问题 。 
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有 下 述 3 种 不 同 的 空闲 块 管理 方法 : 

(1) 空闲 文件 目录 ; 

(2) 空闲 块 链 ; 

(3) 位 示 图 。 

下 面 介绍 这 几 种 管理 方法 。 

1. 空闲 文件 目录 

最 简单 的 空闲 块 管理 方法 就 是 把 文件 存储 设备 中 的 空闲 块 的 块 号 统一 放 在 一 个 称 为 空 
亲 文 件 目 录 的 物理 块 中 。 其 中 空闲 文件 目录 的 每 个 表 项 对 应 一 个 由 多 个 空闲 块 构成 的 空闲 
区 , 它 包括 空闲 块 个 数 、 空 闲 块 号 和 第 一 个 空闲 块 号 等 。 

在 系统 为 某 个 文件 分 配 空 闲 块 时 ,首先 扫描 空闲 文件 目录 项 ,如 找到 合适 的 空闲 区 项 ， 
则 分 配给 申请 者 ,并 把 该 项 从 空白 文件 目录 中 去 掉 。 如 果 一 个 空闲 区 项 不 能 满足 申请 者 要 
求 , 则 把 目录 中 另 一 项 分 配给 申请 者 (连续 文件 结构 除外 )。 如 果 一 个 空闲 区 项 所 含 块 数 超 
过 申请 者 的 要 求 , 则 为 申请 者 分 配 了 所 要 的 物理 块 之 后 ,再 修改 该 表 项 。 

当 一 个 文件 被 删除 ,释放 存储 物理 块 时 ,系统 则 把 被 释放 的 块 号 ,长度 以 及 第 一 块 块 号 

入 空白 目录 文件 的 新 表 项 中 。 

在 内 存 管理 时 讨论 过 有 关 空 闲 连续 区 分 配 和 释放 算法 ,只 要 稍 加 修改 就 可 用 于 空闲 文 
件 项 的 分 配 和 回收 。 

空闲 文件 项 方法 适用 于 连续 文件 结构 的 文件 存储 区 的 分 配 与 回收 。 

2. 空闲 块 链 

空闲 块 链 是 一 种 较 常 用 的 空闲 块 管理 方法 。 空 闲 块 链 把 文件 存储 设备 上 的 所 有 空闲 块 
链接 在 一 起 , 当 申 请 者 需要 空闲 块 时 ,分 配 程序 从 链 头 开始 摘 取 所 需要 的 空闲 块 , 然 后 调整 
链 首 指针 。 反 之 , 当 回收 空闲 块 时 ,把 释放 的 空闲 块 逐个 插入 链 尾 上 。 

空闲 块 链 的 链接 方法 因 系 统 而 异 , 常 用 的 链接 方法 有 按 空闲 区 大 小 顺序 链接 的 方法 、 按 
释放 先后 顺序 链接 的 方法 以 及 成 组 链 法 。 其 中 成 组 链 法 可 被 看 作 空 闲 块 链 的 链接 法 的 
扩展 。 

按 空闲 区 大 小 顺序 链接 和 按 释 放 先 后 顺序 链接 的 空闲 块 管理 ,在 增加 或 移动 空闲 块 时 
需 对 空闲 块 链 做 较 大 的 调整 ,因而 有 一 定 的 系统 开销 。 成 组 链 法 在 空闲 块 的 分 配 和 回收 方 
面 则 要 优 于 上 述 两 种 链接 法 。 下 面 介绍 成 组 链 法 的 基本 原理 。 

成 组 链 法 首先 把 文件 存储 设备 中 的 所 有 空闲 块 按 50 块 划分 为 一 组 。 组 的 划分 为 从 后 
往 前 顺 次 划分 ( 见 图 8. 14) 。 其 中 ,每 组 的 第 一 块 用 来 存放 前 一 组 中 各 块 的 块 号 和 总 块 数 。 
由 于 第 一 组 的 前 面 已 无 其 他 组 存在 ,因此 ,第 一 组 的 块 数 为 49 块 。 不 过 ,由 于 存储 设备 的 空 
间 块 不 一 定 正好 是 50 的 整 倍 数 , 因 而 最 后 一 组 将 不 足 50 块 , 且 由 于 该 组 后 面 已 无 另外 的 空 
闲 块 组 ,所 以 ,该 组 的 物理 块 号 与 总 块 数 只 能 放 在 管理 文件 存储 设备 用 的 文件 资源 表 中 。 

在 成 组 链 法 对 文件 设备 进行 了 上 述 分 组 之 后 ,系统 可 根据 申请 者 的 要 求 进行 空闲 块 的 
分 配 ,并 在 释放 文件 时 回收 空闲 块 。 下 面 介 绍 成 组 链 法 的 空闲 块 分 配 和 释放 过 程 。 

首先 ， A 
块 块 号 与 总 块 数 的 堆栈 进入 内 存 , 并 使 得 空闲 块 的 分 配 与 释放 可 在 内 存 进行 。 这 就 减少 了 
每 次 分 配 和 释放 空间 都 要 启动 /O 〇 设备 的 压力 。 

与 空闲 块 块 号 及 总 块 数 相 对 应 ,用 于 空闲 块 分 配 与 回收 的 堆栈 有 栈 指针 P,, 且 Pu 的 初 
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第 一 组 各 块 号 与 
最 后 组 的 文件 储存 设备 2 总 块 数 
块 号 与 总 y y 
块 | 这 第 三 组 [二 第 二 组 [ 浅 第 一 组 
倒数 第 二 组 各 
文件 资源 表 块 号 与 总 块 数 。 30 所 \ a 2 


第 二 组 各 块 号 与 总 块 数 
图 8.14 成 组 链 法 的 组 织 


值 等 于 该 组 空闲 块 的 总 块 数 。 当 申请 者 提出 空闲 块 要 求 n 时 ,按照 后 进 先 出 的 原则 ,分 配 程 
序 在 取 走 Ps 所 指 的 块 号 之 后 ,再 做 Po 一 Pu 一 1 的 操作 。 这 个 过 程 一 直 持 续 到 所 要 求 的 
块 都 已 分 配 完毕 或 堆栈 中 只 剩 下 最 后 一 个 空闲 块 的 块 号 。 当 堆栈 中 只 剩 下 最 后 一 个 空闲 块 
号 时 ,系统 启动 设备 管理 程序 ,将 该 块 中 存放 的 下 一 组 的 块 号 与 总 块 数 读 人 内 存 之 后 将 该 块 
分 配给 申请 者 。 然 后 ,系统 重新 设置 P, 指 针 ,并 继续 为 申请 者 进程 分 配 空闲 块 。 

文件 存储 设备 的 最 后 一 个 空闲 块 中 设置 有 尾部 标识 ,以 指示 空闲 块 分 配 完毕 。 

如 果 用 户 进程 不 再 使 用 有 关 文件 并 删除 这 些 文件 时 ,回收 程序 回收 装 有 这 些 文件 的 物 
理 块 。 成 组 链 法 的 回收 过 程 仍 利 用 文件 管理 堆栈 进行 。 在 回收 时 ,回收 程序 先 做 Pu 一 Pu 
十 1 操作 ,然后 把 回收 的 物理 块 号 放 入 当前 指针 Pu 所 指 的 位 置 。 如 果 Pu 等 于 50, 则 表示 该 
组 已 经 回收 结束 。 此 时 ,如 果 还 有 新 的 物理 块 需要 回收 的 话 , 回 收 该 块 并 启动 /O 设备 管 
理 程 序 , 把 回收 的 50 个 块 号 与 块 数 写 入 新 回收 的 块 中 。 然 后 ,将 Pu 重新 置 1 另 起 一 个 
新 组 。 

显然 ,对 空闲 块 的 分 配 和 释放 必须 互 斥 进行 ,否则 将 会 发 生 数 据 混乱 。 

3. 位 示 图 

空闲 文件 目录 和 空闲 块 链 法 在 分 配 和 回收 空闲 块 时 ,都 需 在 文件 存储 设备 上 查找 空闲 
文件 目录 项 或 链接 块 号 ,这 必须 经 过 设备 管理 程序 启动 外 设 才能 完成 。 为 了 提高 空闲 块 的 
分 配 和 回收 速度 ,人 们 使 用 位 示 图 的 方法 进行 空闲 块 管理 。 

系统 首先 从 内 存 中 划 出 若干 个 字 节 ,为 每 个 文件 存储 设备 建立 一 张 位 示 图 。 这 张 位 示 
图 反映 每 个 文件 存储 设备 的 使 用 情况 。 在 位 示 图 中 ,每 个 文件 存储 设备 的 物理 块 都 对 应 一 
个 比特 位 。 如 果 该 位 为 0, 则 表示 所 对 应 的 块 是 空闲 块 ; 反 之 ,如 果 该 位 为 1, 则 表示 所 对 应 
的 块 已 被 分 配 出 去 。 

显然 ,利用 位 示 图 来 进行 空闲 块 分 配 时 ,只 需 查 找 图 中 的 0 位 ,并 将 其 置 为 1 位 。 反 之 ， 
利用 位 示 图 回收 时 只 需 把 相应 的 比特 位 由 1 改 为 0 即 可 。 


8.5 文件 目录 管理 


为 了 实现 对 文件 的 按 名 存 取 , 首 先 , 每 个 文件 必须 有 一 个 文件 名 与 其 对 应 。 不 同文 件 类 
型 的 文件 名 由 不 同 的 人 员 指 定 ,一 般 来 说 ,用 户 文件 名 由 用 户 指定 ,系统 文件 和 特殊 文件 在 
系统 设计 时 指定 。 

为 了 有 效 地 利用 存储 空间 以 及 迅速 准确 地 完成 由 文件 名 到 文件 物理 块 的 转换 ,我 们 必 
须 把 文件 名 及 其 结构 信息 等 按 一 定 的 组 织 结构 排列 ,以 方便 文件 的 搜索 。 把 文件 名 和 对 该 
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文件 实施 控制 管理 的 控制 管理 信息 称 为 该 文件 的 文件 说 明 ,并 把 一 个 文件 说 明 按 一 定 的 逻 
辑 结构 存放 到 物理 存储 块 的 一 个 表 目 中 。 利 用 文件 说 明 信 息 ,可 以 完成 对 文件 的 创建 .检索 
以 及 维护 作用 。 因 此 ,把 一 个 文件 的 文件 说 明 信 息 称 为 该 文件 的 目录 。 对 文件 目录 的 管理 
就 是 对 文件 说 明 信 息 的 管理 。 

文件 目录 的 管理 除了 要 解决 存储 空间 的 有 效 利 用 之 外 ,还 要 解决 快速 搜索 ,文件 命名 冲 
突 以 及 文件 共享 问题 。 下 面 分 别 说 明 。 


8.5.1 文件 的 组 成 


从 文件 管理 角度 看 ,一 个 文件 包括 两 部 分 : 文件 说 明和 文件 体 。 

文件 体 指 文件 本 身 的 信息 , 它 可 能 是 前 面 各 节 讨 论 的 记录 式 文件 或 字符 流 式 文件 。 

文件 说 明 有 时 也 叫 文件 控制 块 (FCB) , 它 至 少 包括 文 件 名 ,与 文件 名 相对 应 的 文件 内 部 
标识 以 及 文件 信息 在 文件 存储 设备 上 第 一 个 物理 块 的 地 址 (物理 结构 是 边 连 续 结构 时 )。 另 
外 ,根据 系统 要 求 不 同 , 它 还 包括 关于 文件 逻辑 结构 物理 结构 、 存 取 控 制 和 管理 等 的 信息 
等 。 这 里 的 管理 信息 主要 指 访问 时 间 和 记 账 信息 等 。 

文件 说 明 组 成 目录 文件 。 文件 系统 利用 目录 文件 完成 按 名 存 取 和 对 文件 信息 的 共享 与 
保护 。 


8.5.2 文件 目录 


文件 目录 可 分 为 单 级 目录 、 二 级 目录 和 多 级 目录 。 

单 级 目录 是 一 种 最 简单 .最 原始 的 目录 结构 。 文 件 系统 为 存储 设备 的 所 有 文件 建立 一 
张 目录 表 , 每 个 文件 在 其 中 占有 一 项 用 来 存放 文件 说 明 信 息 。 该 目录 表 存 放 在 存储 设备 的 
某 固定 区 域 ,在 系统 初 启 时 或 需要 时 ,系统 将 其 调和 内存 (或 部 分 调和 人 内存) 。 文 件 系统 通过 
该 表 提 供 的 信息 对 文件 进行 创建 .搜索 和 删除 等 操作 。 例 如 , 当 建 立 一 个 文件 时 ,首先 从 该 
表 中 申请 一 项 ,并 存 人 有 关 说 明 信 息 ; 当 删除 一 个 文件 时 ,就 从 该 表 中 删 去 一 项 。 

严格 地 说 ,利用 单 级 目录 ,文件 系统 就 可 实现 对 文件 系统 空间 的 自动 管理 和 按 名 存 取 。 
例如 , 当 用 户 进程 要 求 对 某 个 文件 进行 读 写 操作 时 ,调用 有 关系 统 调用 由 事件 驱动 或 中 断 总 
控 方式 进入 文件 系统 ,此 时 ,CPU 控制 权 在 文件 系统 手中 。 文 件 系统 首先 根据 用 户 给 定 的 
文件 名 搜索 单 级 文件 目录 表 , 以 查找 文件 信息 的 物理 块 号 。 如 果 搜 索 不 到 对 应 的 文件 名 , 则 
失败 返回 ( 读 操作 时 ) ,或 由 空闲 块 分 配 程序 进行 空闲 块 分 配 后 ,再 修改 单 级 目录 表 。 如 果 已 
找到 对 应 的 第 一 个 物理 块 块 号 , 则 根据 文件 对 应 的 物理 结构 信息 计算 出 所 要 读 写 的 信息 块 
物理 块 块 号 ,然后 把 CPU 控制 权 交 给 设备 管理 系统 启动 设备 进行 读 写 操作 。 单 级 目录 时 
的 文件 系统 读 写 处 理 过 程 如 图 8. 15 所 示 。 

不 过 ,由 于 在 单 级 目录 表 中 ,各 文件 说 明 项 都 处 于 平等 地 位 ,只 能 按 连 续 结构 或 顺序 
构 存放 ,因此 ,文件 名 与 文件 必须 一 一 对 应 。 如 果 两 个 不 同 的 文件 重 名 的 话 , 则 系统 将 把 它 
们 视 为 同一 文件 。 另 外 ,由 于 在 单 级 目录 中 必须 对 所 有 文件 信息 项 进行 搜索 ,因而 ,搜索 效 
率 也 较 低 。 

为 了 改变 单 级 目录 中 文件 命名 冲突 问题 和 提高 对 目录 表 的 搜索 速度 , 单 级 目录 被 扩充 
成 二 级 目录 。 

在 二 级 目录 结构 中 ,各 个 文件 的 说 明 信 息 被 组 织 成 目录 文件 , 且 以 用 户 为 单位 把 各 自 的 
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1 系统 调用 
控制 权 交 给 文件 系统 
1 
根据 给 定 的 文件 名 
搜索 单 级 目录 表 
文件 名 在 否 
目录 表 中 吗 9 
是 谍 还 是 写 ? 下 
1 
计算 读 写 信息 的 物理 块 号 15 
I 分 配 存储 空间 | 《失败 返回 ) 
调用 设备 管理 程序 1 
控制 权 转 移 改写 单 级 目录 表 
| 


图 8.15 单 级 目录 的 读 写 处 理 过 程 


文件 说 明 划 分 为 不 同 的 组 。 然 后 ,这 些 不 同 的 组 名 有 关 的 存 取 控制 信息 存放 在 主 目录 
(MFD) 的 目录 项 中 。 与 MFD 相对 应 ,用 户 文件 的 文件 说 明 所 组 成 的 目录 文件 被 称 为 用 户 
文件 目录 (CUFD)。 这 样 ,由 MFD 和 UFD 就 形成 二 级 目录 ,其 结构 如 图 8. 16 所 示 。 


Wang 的 文件 目录 UFD 
一 一 一 | 文件 名 | 各 种 属性 | 物理 始 址 
主 目录 MFD Editor 多 2 | 
户 名 天 术 控制 I : Editor 
: | | Zhang 的 文件 目录 UFD ey 
We 区 到 一 | 文件 名 | 各 种 属性 | 物理 始 址 | 人 
Zhang | … | 一 | AC 区 LA 
| | Editor a.c( 同 名 文件 ) 


图 8.16 二 级 目录 结构 


当 用 户 要 对 一 个 文件 进行 存 取 操作 或 创建 、 删 除 一 个 文件 时 ,首先 从 MFD 找到 对 应 的 
目录 名 ,并 从 用 户 名 查找 到 该 用 户 的 MFD。 余 下 的 操作 与 单 级 目录 时 相同 。 

使 用 二 级 目录 可 以 解决 文件 重 名 和 文件 共享 问题 ,并 可 获得 较 高 的 搜索 速度 。 由 于 采 
用 二 级 目录 时 首先 从 MFD 开始 搜索 ,因此 ,从 系统 管理 的 角度 来 看 ,文件 名 已 演变 成 为 用 
户 名 /用 户 文件 名 。 从 而 ,即使 两 个 不 同 的 用 户 具 有 同名 文件 ,系统 也 会 把 它们 区 别 开 来 。 
再 者 ,利用 二 级 目录 ,也 可 以 方便 地 解决 不 同 用 户 间 的 文件 共享 问题 ,这 只 要 在 被 共享 的 文 
件 说 明 信 息 中 增加 相应 的 共享 管理 项 ,并 把 共享 文件 的 文件 说 明 项 指向 被 共享 文件 的 文件 


说 明 项 即 可 。 
。 199 。 


另外 ,与 单 级 目录 相 比 ,如 果 单 级 目录 表 的 长 度 为 n 的 话 , 则 单 级 目录 时 的 搜索 时 间 与 
n 成 正比 ;在 二 级 目录 时 ,由 于 的 目录 已 被 划分 为 m 个 子 集 , 则 二 级 目录 的 搜索 时 间 是 与 
m 十 r 成 正比 的 。 这 里 的 m 是 用 户 个 数 ,r 是 每 个 用 户 的 文件 的 个 数 。 一 般 有 mw 十 r 过 nn, 从 
而 二 级 目录 的 搜索 时 间 要 快 于 单 级 目录 。 

把 二 级 目录 的 层次 关系 加 以 推广 ,就 形成 了 多 级 目录 。 在 多 级 目录 结构 中 ,除了 最 低 一 
级 的 物理 块 中 装 有 文件 信息 外 ,其 他 每 一 级 目录 中 存放 的 都 是 下 一 级 目录 或 文件 的 说 明 信 
息 。 由 此 形成 层次 关系 ,最 高 层 为 根 目 录 , 最 低层 为 文件 。 多 级 目录 构成 树 形 结构 ,如 图 8. 17 
所 示 。 


根 目录 
() 
() 3) (2 
(s) (5 
4] [3] [2 ul] po [|] [|] [|] 文 作 


( 〇 :目录 文件 | ] :数据 文件 


图 8.17 文件 系统 的 树 形 结构 


树 形 结构 的 多 级 目录 具有 下 列 特点 : 

(1) 层次 清楚 。 由 于 采用 分 支 结构 ,不 同性 质 ,. 不 同 用 户 的 文件 可 以 构成 不 同 的 子 树 ， 
便于 管理 。 不 同 层次 ,不同 用 户 的 文件 可 以 被 赋予 不 同 的 存 取 权 限 , 有 利于 文件 的 保护 。 

(2) 解决 了 文件 重 名 问题 。 文 件 在 系统 中 的 搜索 路 径 是 从 根 开始 到 文件 名 为 止 的 各 文 
件 名 组 成 的 ,因此 ,只 要 在 同一 子 目录 下 的 文件 名 不 发 生 重 复 , 就 不 会 由 文件 重 名 而 引起 
混乱 。 

(3) 查找 搜索 速度 快 。 在 8.2 节 讨论 的 对 文件 中 关键 字 的 各 种 搜索 方法 ,例如 线性 搜 
索 法 . 散 列 法 以 及 二 分 搜索 法 都 可 用 来 对 各 级 目录 进行 查找 。 由 于 对 多 级 目录 的 查找 每 次 
只 查找 目录 的 一 个 子 集 , 因 此 ,其 搜索 速度 较 单 级 目录 和 二 级 目录 时 更 快 。 


8.5.3 便于 共享 的 文件 目录 


文件 系统 的 一 个 重要 任务 就 是 为 用 户 提 供 共 享 文件 信息 的 手段 。 这 是 因为 对 于 某 一 个 
公用 文件 来 说 ,如 果 每 个 用 户 都 在 文件 系统 内 保留 一 份 该 文件 的 副本 ,这 将 极 大 地 浪费 存储 
空间 。 如 果 系 统 提 供 了 共享 文件 信息 的 手段 , 则 在 文件 存储 设备 上 只 需 存 储 一 个 文件 副本 ， 
共享 该 文件 的 用 户 以 自己 的 文件 名 去 访问 该 文件 的 副本 就 可 以 了 。 

从 系统 管理 的 观点 看 ,有 3 种 方法 可 以 实现 文件 共享 

(1) 绕道 法 ; 

(2) 链接 法 ; 

(3) 基本 文件 目录 表 (BFD)。 

绕道 法 要 求 每 个 用 户 处 在 当前 目录 下 工作 ,用 户 对 所 有 文件 的 访问 都 是 相对 于 当前 目 
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录 进 行 的 。 用 户 文件 的 固有 名 (为 了 访问 某 个 文件 而 必须 访问 的 各 个 目录 和 文件 的 目录 名 
与 文件 名 的 顺序 连接 称 为 固有 名 ) 是 由 当前 目录 到 信息 文件 通路 上 所 有 各 级 目录 的 目录 名 
加 上 该 信息 文件 的 符号 名 组 成 。 使 用 绕道 法 进行 文件 共享 时 ,用 户 从 当前 目录 出 发 向 上 返 
回 到 与 所 要 共享 文件 所 在 路 径 的 交叉 点 ,再 顺序 下 访 到 共享 文件 。 绕 道 法 需要 用 户 指 定 所 
要 共享 文件 的 逻辑 位 置 或 到 达 被 共享 文件 的 路 径 。 绕 道 法 的 原理 如 图 8. 18 所 示 。 


与 被 共享 文件 所 在 路 径 的 交叉 点 


文件 


| 


显然 ,绕道 法 要 绕 弯路 访问 多 级 目录 ,从 而 其 搜索 效率 不 高 。 为 了 提高 共享 其 他 目录 中 
文件 的 速度 , 另 一 种 共享 的 办 法 是 在 相应 目录 表 之 间 进 行 链接 。 即 将 一 个 目录 中 的 链 指针 
直接 指向 被 共享 文件 所 在 的 目录 。 链 接 法 仍然 需要 用 户 指 定 被 共享 的 文件 和 被 链接 的 
目录 。 

实现 文件 共享 的 一 种 有 效 方法 是 采用 基本 文件 目录 表 (BFD) 的 方法 。 该 方法 把 所 有 文 
件 目 录 的 内 容 分 成 两 部 分 : 一 部 分 包括 文件 的 结构 信息 、 物 理 块 号 . 存 取 控制 和 管理 信息 
等 ,并 由 系统 赋予 唯一 的 内 部 标识 符 来 标识 ; 另 一 部 分 则 由 用 户 给 出 的 符号 名 和 系统 赋 给 文 
件 说 明 信 息 的 内 部 标识 符 组 成 。 这 两 部 分 分 别称 为 符号 文件 目录 表 (SFD) 和 基本 文件 目录 
表 (BFD)。SFD 中 存放 文件 名 和 文件 内 部 标识 符 ,BFD 中 存放 除了 文件 名 之 外 的 文件 说 明 
信息 和 文件 的 内 部 标识 符 。 这 样 组 成 的 多 级 目录 结构 如 图 8. 19 所 示 。 

在 图 8. 19 中 ,为 了 简单 起 见 ,未 在 BFD 表 项 中 列 出 结构 信息 、 存 取 控制 信息 和 管理 控 
制 信息 等 。 另 外 ,在 文件 系统 中 ,系统 通常 预先 规定 赋予 基本 文件 目录 、 空 白文 件 目 录 和 主 
目录 (MFD) 的 符号 文件 目录 固定 不 变 的 唯一 标识 符 ,在 图 中 它们 分 别 为 0、1、2。 

采用 基本 文件 目录 方式 可 较 方 便 地 实现 文件 共享 。 如 果 用 户 要 共享 某 个 文件 , 则 只 需 
给 出 被 共享 的 文件 名 ,系统 就 会 自动 在 SFD 的 有 关 文 件 处 生成 与 被 共享 文件 相同 的 内 部 标 
识 符 ID。 例 如 在 图 8. 19 中 ,用 户 Wang 和 Zhang 共享 标识 符 为 6 的 文件 ,对 于 系统 来 说 ， 
标识 符 6 指向 同一 个 文件 ;而 对 Wang 和 Zhang 两 用 户 来 说 , 则 对 应 于 不 同 的 文件 名 b.c 和 


fs 


图 8.18 绕道 法 


8.5.4 目录 管理 


由 上 面 讨 论 可 知 , 存 放 文 件 说 明 信 息 或 目录 管理 说 明 信 息 的 目录 项 构成 目录 文件 ,这 些 
文件 同样 存放 在 文件 存储 设备 中 。 在 存 取 一 个 文件 时 ,必须 访问 多 级 目录 。 如 果 访 问 每 级 
目录 时 都 必须 到 文件 存储 设备 上 去 搜索 的 话 , 这 不 仅 大 大 浪费 CPU 的 处 理 时 间 , 降 低 了 处 
理 速 度 ,而 且 还 给 输入 输出 设备 增加 了 不 应 有 的 负担 。 一 种 解决 办 法 是 在 系统 初 启 时 ,把 所 
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一 一 物理 | | 一 一 一 一 一 | 空闲 文 件 目录 
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1 . 
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3 “| ac 5 一 一 | fe 6 
4 a.c b.c 6 Z.C 7 
5 OO Sub_d 8 
b.c 
9 DR 
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图 8.19 采用 基本 文件 目录 的 多 级 目录 结构 


有 的 目录 文件 读 和 内存, 由 文件 系统 在 内 存 完成 对 各 级 目录 的 搜索 。 这 不 仅 减 轻 了 输入 输 
出 设备 的 负担 ,而 且 由 于 内 存 访 问 速 度 高 ,因此 ,处 理 速 度 也 将 大 大 提高 。 不 过 ,这 种 方法 需 
要 大 量 的 内 存 支 持 , 显 然 是 不 可 取 的 。 另 一 种 折 中 的 方法 是 : 把 当前 正在 使 用 的 那些 文件 
的 目录 表 目 复制 到 内 存 中 ,这 样 , 既 不 占 太 多 的 内 存 容 量 ,又 可 显著 地 减少 搜索 目录 的 时 间 
和 输入 输出 设备 的 压力 。 为 此 ,系统 提供 两 种 特殊 的 操作 ,把 有 关 的 目录 文件 复制 到 内 存 的 
指定 区 ,以 及 当 用 户 不 再 访问 有 关 信 息 文件 时 删除 有 关 目 录 文 件 的 内 存 副本 。 

把 文件 存储 设备 上 的 目录 文件 复制 到 内 存 的 操作 称 为 打开 文件 (fopen) ,而 把 删除 文件 
的 内 存 副 本 的 操作 称 为 关闭 文件 (fclose)。 这 两 个 操作 一 般 以 系统 调用 的 方式 提供 给 用 户 。 
对 于 按 BDF 和 SFD 方式 排列 的 多 级 文件 目录 来 说 ,系统 按 以 下 方式 打开 一 个 文件 。 

(1) 把 主 目录 (MFD) 中 的 相应 表 目 ,也 就 是 与 待 打 开 文 件 相 联系 的 有 关 表 目 复 制 到 内 
存 。 例 如 , 若 准备 打开 图 8. 19 中 的 文件 a.c, 则 将 MFD 中 的 第 一 项 (Wang) 复 制 到 内 存 。 

(2) 根据 (1) 所 复制 得 到 的 标识 符 , 再 复制 此 标识 符 所 指明 的 基本 文件 目录 表 (CBDF ) 的 
有 关 表 目 , 例 如 图 8. 19 中 的 ID=3 的 BDF 中 的 表 目 项 。 这 个 表 目 中 包括 有 存 取 控制 信息 、 
结构 信息 以 及 下 级 目录 的 物理 块 号 等 。 

(3) 根据 (2) 所 得 到 的 子 目 录 说 明 信 息 搜 索 SFD, 以 找到 与 待 打 开 文 件 相 对 应 的 目录 表 
项 。 如 果 找 到 的 表 目 仍然 是 子 目 录 名 , 则 系统 将 根据 其 对 应 的 标识 符 ID 继续 上 述 复制 过 
程 ,直到 所 找到 的 表 目 是 待 打 开 的 文件 名 ,例如 在 图 8. 19 中 的 文件 名 a. c。 

(4) 根据 (3) 所 搜索 到 的 文件 名 所 对 应 的 标识 符 ID, 把 相应 的 BDF 的 表 目 项 复制 到 内 
存 。 这 样 , 待 打 开 文件 的 说 明 信 息 就 已 复制 到 了 内 存 中 。 由 复制 的 文件 说 明 , 系 统 显 然 可 以 
方便 地 得 到 文件 的 有 关 物 理 块 号 。 从 而 ,系统 可 对 文件 进行 有 关 操 作 。 

在 完成 了 上 述 4 个 步骤 之 后 ,就 说 文件 是 被 打开 的 了 , 称 这 样 的 文件 为 打开 的 文件 或 活 
动 文 件 。 而 且 , 把 内 存 中 存放 活动 文件 的 SFD 表 目 的 表 称 为 活动 名 字 表 ,这 个 表 每 个 用 户 
一 张 。 另 外 ,把 内 存 中 存放 活动 文件 的 BFD 表 目 的 表 称 为 活动 文件 表 , 这 个 表 整 个 系统 
一 张 。 

。 202 。 


8.6 文件 存 取 控制 


本 节 介 绍 文件 的 存 取 控制 问题 。 文 件 的 存 取 控制 是 和 文件 的 共享 、 保 护 和 保密 3 个 不 
同 而 又 相互 联系 的 问题 紧密 相关 的 。 前 面 各 节 中 简单 地 提 及 了 文件 的 共享 ,但 未 涉及 文件 
的 保护 和 保密 。 

文件 共享 是 指 不 同 的 用 户 共 同 使 用 一 个 文件 。 

文件 保护 则 指 文件 本 身 需 要 防止 文件 的 拥有 者 本 人 或 其 他 用 户 破坏 文件 内 容 。 

文件 保密 指 未 经 文件 拥有 者 许可 ,任何 用 户 不 得 访问 该 文件 。 

这 3 个 问题 实际 上 是 一 个 用 户 对 文件 的 使 用 权限 , 即 读 、 写 、 执 行 的 许可 权 问 题 。 

具体 地 说 ,文件 系统 的 存 取 控制 部 分 应 做 到 : 

(1) 对 于 拥有 读 、 写 或 执行 权限 的 用 户 , 应 让 其 对 文件 进行 相应 的 操作 。 

(2) 对 于 没有 读 、 写 或 执行 权限 的 用 户 , 应 禁止 他 们 对 文件 进行 相应 的 操作 。 

(3) 应 防止 一 个 用 户 冒 充 其 他 用 户 对 文件 进行 存 取 。 

(4) 应 防止 拥有 存 取 权限 的 用 户 误 用 文件 。 

这 些 功 能 是 由 一 组 称 为 存 取 控制 验证 模块 的 程序 提供 的 。 它 们 分 3 步 验证 用 户 的 存 取 


(1) 审定 用 户 的 存 取 权限 。 

(2) 比较 用 户 权 限 与 用 户 的 本 次 存 取 要 求 是 否 一 致 。 

(3) 将 存 取 要 求 和 被 访问 文件 的 保密 性 比较 ,看 是 否 有 冲突 。 

一 般 可 有 下 述 4 个 方式 来 验证 用 户 的 存 取 操作 : 

(1) 存 取 控制 矩阵 ; 

(2) 存 取 控 制 表 ; 

(3) 口令 ; 

(4) 密码 术 。 

系统 设计 人 员 根 据 需 要 选择 其 中 一 种 或 几 种 并 将 相应 的 数据 结构 置 于 文件 说 明 (BFD 
等 ) 中 ,在 用 户 访 问 文件 时 ,对 用 户 的 存 取 权限 、 存 取 要 求 的 一 致 性 以 及 保密 性 等 进行 验证 。 
下 面 简单 地 介绍 这 4 种 方式 。 

1. 存 取 控 制 矩 阵 

存 取 控制 矩阵 方式 以 一 个 二 维和 矩阵 来 进行 存 取 控 制 。 二 维 矩 阵 的 一 维 是 所 有 的 用 户 ， 
另 一 维 是 所 有 的 文件 。 对 应 的 矩阵 元 素 则 是 用 户 对 文件 的 存 取 权 限 ,包括 读 (R)、 写 (W) 和 
执行 (E) ,如 图 8.20 所 示 。 

当 用 户 向 文件 系统 提出 存 取 要 求 时 ,由 存 取 控制 验证 模块 根据 该 矩阵 内 容 对 本 次 存 取 
要 求 进行 比较 ,如 果 不 匹 配 的 话 ,系统 拒绝 执行 。 

存 取 控制 矩阵 的 方法 虽然 在 概念 上 比较 简单 ,但 是 , 当 文 件 和 用 户 较 多 时 , 存 取 控制 矩 
阵 将 变 得 非常 庞大 ,这 无 论 是 在 占用 内 存 空 间 的 大 小 上 ,还 是 在 为 使 用 文件 而 对 和 矩阵 进行 扫 
描 的 时 间 开 销 上 都 是 不 合适 的 。 因 此 ,在 实现 时 往往 采取 某 些 辅助 措施 以 减少 时 间 和 空间 
的 开销 。 
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受 人 、 文件 名 a 
如 分 Wang | Lee | Zhang 用 户 

文 件 名 Zhang RWE 
A RWE E RWE A 组 RE 
Be RW R RWE B 组 E 
DG R Ww WE Wang RWE 
E.C R W RW 其 他 None 

图 8. 20 存 取 控制 矩阵 图 8.21 存 取 控制 表 
2. 存 取 控 制 表 


存 取 控制 表 以 文件 为 单位 ,把 用 户 按 某 种 关系 划分 为 若干 组 ,同时 规定 每 组 的 存 取 权 
限 。 这 样 ,所 有 用 户 组 对 文件 权限 的 集合 就 形成 了 该 文件 的 存 取 控 制 表 , 如 图 8. 21 所 示 。 

每 个 文件 都 有 一 张 存 取 控 制 表 。 在 实现 时 ,该 表 存 放 在 文件 说 明 中 ,也 就 是 BFD 的 有 
关 表 目 中 。 文 件 被 打开 时 ,由 于 存 取 控制 表 也 相应 地 被 复制 到 了 内 存活 动 文件 中 ,因此 , 存 
取 控 制 验证 能 高 效 地 进行 。 

3. 口令 方式 

口令 方式 有 两 种 。 一 种 是 当 用 户 进入 系统 ,为 建立 终端 进程 时 获得 系统 使 用 权 的 口令 。 
et ame di aa enol en 
绝 。 另 一 种 口令 方式 是 ,每 个 用 户 在 创建 文件 时 ,为 每 一 个 创建 的 文件 设置 一 令 , 且 将 
其 置 于 文件 说 明 中 。 当 任 一 用 户 想 使 用 该 文件 时 ， A aa 
才 人 允许 存 取 。 显 然 ， 上 若 允 许 其 他 用 户 使 用 自己 的 文件 ,口令 设置 
者 可 将 口令 赋予 其 他 用 户 。 这 样 , 既 可 以 做 到 文件 共享 ,又 可 做 到 保密 。 而 且 , 由 于 口令 较 
为 简单 ,占用 的 内 存单 元 以 及 验证 口令 所 费时 间 都 将 非常 少 。 不 过 ,相对 来 说 ,口令 方式 保 
密 性 能 较 差 。 口 令 一 旦 被 别人 掌握 ,就 可 以 获得 与 文件 主 同 样 的 权利 而 没有 任何 等 级 差别 ， 
这 就 使 得 文件 失窃 的 可 能 性 大 大 增加 。 再 者 , 当 要 修改 某 个 用 户 的 存 取 权 限时 ,文件 主 必 须 
修改 口令 ,这样 ,所 有 共享 该 文件 的 用 户 的 存 取 权 限 都 被 取消 ,除非 文件 主将 新 的 口令 通知 
用 户 。 

4. 密码 方式 

防止 文件 泄密 以 及 控制 存 取 的 另 一 种 方法 是 密码 方式 。 密 码 方式 在 用 户 创建 源 文件 并 
将 其 写 和 人 存储 设备 时 对 文件 进行 编码 加 密 ,在 读 出 文件 时 对 其 进行 译 码 解密 。 显 然 , 只 有 能 
够 进行 译 码 解密 的 用 户 才能 读 出 被 加 密 的 文件 信息 ,从 而 起 到 文件 保密 的 作用 。 

文件 的 加 密 和 解密 都 需要 用 户 提 供 一 个 代码 键 (KEY)。 加 密 程序 根据 这 一 代码 键 对 
用 户 文件 进行 编码 变换 ,然后 将 其 写 和 人 存储 设备 。 在 读 取 文件 时 ,只 有 用 户 给 定 的 代码 键 与 
加 密 时 的 代码 键 相 一 致 时 ,解密 程序 才能 对 加 密 文件 进行 解密 ,将 其 还 原 为 源 文 件 。 加 密 处 
理 过 程 如 图 8. 22 所 示 。 

加 密 方 式 具 有 保密 性 强 的 优点 ,因为 与 口令 不 同 , 进 行 编码 解码 的 代码 键 没 有 存放 在 系 
统 中 ,而 是 由 用 户 自己 掌握 。 但 是 ,由 于 编码 解码 工作 要 耗费 大 量 的 处 理 时 间 , 因 此, 加密 技 
术 是 以 牺牲 系统 开销 为 代价 的 。 
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户 指定 代码 键 存 取 要 求 指定 代码 键 


; 有 户 
用 户 文件 | 高 码 程序 | 密码 文件 一 | 解码 程序 人 


| 


存储 
图 8.22 加 密 解 密 过 程 


8.7 文件 的 使 用 


上 面 各 节 主 要 从 系统 管理 的 角度 讨论 文件 系统 。 本 节 讨 论文 件 系 统 对 用 户 的 接口 。 

文件 系统 以 系统 调用 方式 或 命令 方式 为 用 户 提供 下 列 几 类 服务 : 

(1) 关于 设置 和 修改 用 户 对 文件 的 存 取 权 限 的 服务 ; 

(2) 关于 建立 改变 和 删除 目录 的 服务 ， 

(3) 关于 文件 共享 .设置 访问 路 径 的 服务 ; 

(4) 创建 .打开 、. 读 写 . 关 闭 以 及 撤销 文件 的 服务 。 

这 些 服务 的 调用 名 和 参数 都 因 系 统 而 异 。 例 如 在 UNIX 系统 中 ,chmod 命令 可 用 来 改 
变 一 个 或 多 个 文件 或 目录 的 读 写 控制 模式 。 读 者 可 在 UNIX 环境 下 使 用 命令 man chmod 
命令 阅读 到 chmod 命令 的 全 部 详细 信息 。 男 外 ,mkdir、cd、rmdir 等 命令 则 可 用 来 建立 、 改 
变 和 删除 指定 的 目录 。 有 关 这 些 命令 的 详细 信息 ,同样 可 由 man 命令 从 UNIX 系统 中 得 
到 ,这 里 不 作 介绍 。 

有 关 对 文件 操作 的 命令 都 基于 操作 系统 提供 的 系统 调用 。 这 些 系统 调用 包括 建立 文件 
用 的 creat, 读 文件 用 的 read, 关 闭 文件 用 的 close 以 及 撤销 文件 用 的 delete 等 。 

其 中 ,creat 调用 将 根据 用 户 提供 的 文件 名 和 属性 ,在 指定 的 文件 存储 设备 上 建立 一 个 
文件 并 把 文件 标识 符 返 回 给 用 户 。open 调用 把 在 文件 存储 设备 上 的 有 关 文 件 说 明 信 息 复 
制 到 内 存 的 活动 文件 目录 表 中 。write 调用 将 把 从 内 存 中 某 个 位 置 开始 的 一 段 n 字 节 长 ( 字 
符 流 文件 时 ) 信 息 或 个 记录 经 设备 管理 程序 写 人 文件 存储 设备 。read 调用 的 功能 与 write 
相反 , 它 把 指定 文件 的 几 个 字 节 或 记录 读 和 人 内存 中 的 指定 区 域 。 若 文件 暂时 不 用 时 ,系统 调 
用 close 关闭 该 文件 。close 调用 撤销 活动 文件 表 中 相应 的 表 目 。delete 调用 则 在 一 个 文件 
不 再 被 访问 时 ,删除 该 文件 在 文件 存储 设备 上 的 有 关 说 明 信 息 ,并 释放 该 文件 所 占据 的 全 部 
存储 空间 。 


8.8 文件 系统 的 层次 模型 


在 上 面 各 节 中 ,从 系统 和 用 户 两 方面 的 角度 讨论 了 文件 系统 的 基本 概念 和 功能 。 在 本 
节 中 ,将 介绍 文件 系统 的 一 般 层 次 模型 ,以 便 使 读者 对 文件 系统 形成 一 个 完整 的 概念 。 
操作 系统 的 层次 结构 的 设计 方法 是 Dijkstra 于 1967 年 提出 的 ,1968 年 Madnick 将 这 
一 思想 引入 了 文件 系统 。 层 次 结构 法 的 优点 是 ,可 以 按照 系统 所 提供 的 功能 来 划分 为 各 种 
不 同 的 层次 ,下 层 为 上 层 提供 服务 ,上 层 使 用 下 层 的 功能 。 这 样 ,上 下 层 之 间 彼 此 无 须 了 解 
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对 方 的 内 部 结构 和 实现 方法 ,而 只 关心 二 者 的 接口 。 从 而 ,一 个 看 上 去 十 分 复杂 的 系统 将 会 
由 于 层次 的 划分 而 变 得 易于 设计 、 理 解 和 实现 。 而 且 , 当 系统 出 现 错误 时 ,也 容易 进行 查 错 
和 调整 。 因 此 ,层次 化 设计 方法 也 使 得 系统 的 管理 和 维护 更 加 容易 。 

不 过 ,在 层次 化 设计 方法 中 ,层次 的 划分 是 一 个 十 分 复杂 的 问题 。 如 果 层 次 划分 太 少 ， 
则 每 一 层 的 内 容 仍然 十 分 复杂 ,分 层 的 意义 不 明显 ; 若 层 次 划分 太 多 , 则 各 层 之 间 传 递 的 参 
数 会 急剧 增加 ,而 且 每 一 层 的 处 理会 占 去 一 定 的 系统 开销 ,从 而 影响 系统 效率 。 因 此 ,层次 
的 划分 要 根据 实际 需要 仔细 地 考虑 。Madnick 把 文件 系统 划分 为 8 层 , 如 图 8. 23 所 示 。 
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图 8.23 文件 系统 的 层次 模型 


在 图 8. 23 中 ,第 1 层 是 用 户 接口 ,该 层 根据 用 户 对 文件 的 存 取 要 求 , 把 不 同 的 系统 调用 
加 工 改造 成 不 同 的 内 部 调用 格式 。 

第 2 层 是 符号 文件 系统 层 。 该 层 完成 第 1 层 所 提供 的 功能 ,并 把 第 1 层 所 提供 的 参 
数 一 一 用 户 文件 名 转换 成 系统 内 部 的 唯一 标识 符 fd, 该 层 的 主要 工作 是 搜索 文件 目录 ,也 
就 是 搜索 SFD, 以 找到 相应 文件 名 的 表 目 以 找到 fd。 然 后 ,fd 将 作为 参数 传 给 第 3 层 。 

第 3 层 是 基本 文件 系统 层 。 该 层 根据 第 2 层 的 调用 参数 fd, 找 到 文件 的 说 明 信 息 ,包括 
存 取 控 制 表 、 文 件 逻辑 结构 ,物理 结 构 以 及 第 一 个 物理 块 地 址 等 。 

第 4 层 是 存 取 控制 验证 层 。 该 层 的 主要 功能 是 根据 存 取 控制 信息 和 用 户 访 问 要 求 , 检 
验 文件 访问 的 合法 性 ,从 而 实现 文件 的 共享 ,保护 和 保密 。 

第 5 层 是 逻辑 文件 系统 层 。 该 层 的 主要 功能 是 根据 文件 的 逻辑 结构 ,找到 所 要 进行 操 
作 的 数据 或 记录 的 相对 抉 号 。 对 于 字符 流 的 无 结构 文件 来 说 ,只 要 把 用 户 指定 的 钦 辑 地 址 
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按 块 长 换算 成 相对 块 号 就 可 以 了 。 但 是 ,对 于 记录 式 有 结构 文件 来 说 ,由 于 用 户 有 时 指定 的 
是 关键 字 或 记录 名 ,因此 , 需 首先 由 关键 字 ( 或 记录 名 ) 搜 索 到 相应 的 记录 并 得 到 对 应 的 逻辑 
地 址 之 后 ,再 将 其 转换 为 相对 块 号 。 

第 6 层 是 物理 文件 系统 层 。 该 层 把 相对 块 号 根据 文件 的 物理 结构 转换 成 物理 地 址 。 

第 7 层 是 文件 存储 设备 分 配 模块 和 设备 策略 模块 。 文 件 存 储 设备 分 配 模块 实现 对 空闲 
存储 块 的 管理 ,包括 分 配 、 释 放 和 组 织 。 设 备 策略 模块 主要 是 把 物理 块 号 转换 成 相应 文件 存 
储 设 备 所 要 求 的 地 址 格式 ,例如 磁盘 的 柱 面 号 、 磁 道 号 和 盘 区 号 等 。 然 后 ,根据 具体 的 操作 
要 求 及 必要 的 参数 ,准备 启动 输入 输出 设备 的 命令 。 

第 8 层 是 启动 输入 输出 层 。 由 设备 处 理 程序 执行 具体 的 读 或 写 文件 操作 。 

第 7 层 和 第 8 层 是 文件 系统 和 设备 管理 程序 的 接口 层 。 


本 章 小 结 


文件 系统 为 用 户 提 供 了 按 名 存 取 的 功能 ,以 使 得 用 户 能 透明 地 存 取 文 件 。 为 了 实现 按 
名 存 取 ,文件 需要 对 文件 存储 设备 进行 合理 的 组 织 、 分 配 和 管理 ;对 存储 在 文件 存储 设备 上 
的 文件 进行 保护 ,保密 和 提供 共享 的 手段 。 另 外 ,文件 系统 还 要 提供 检索 文件 或 文件 中 记录 
的 手段 。 文 件 系统 就 是 完成 上 述 功能 的 一 组 软件 和 数据 结构 的 集合 。 

本 章 主要 讨论 了 文件 和 文件 系统 的 基本 概念 。 文 件 是 一 组 赋 名 的 字符 流 的 集合 或 一 组 
相关 联 的 记录 的 集合 。 一 个 记录 是 有 意义 的 信息 的 基本 单位 , 它 有 定 长 和 变 长 两 种 基本 格 
式 。 本 章 在 定 长 的 假定 下 讨论 ,但 其 结果 也 可 以 扩展 到 变 长 格式 的 情况 。 

为 了 合理 有 效 地 利用 存储 空间 ,以 及 高 效率 地 进行 按 名 存 取 ,文件 按 一 定 的 逻辑 结构 组 
成 逻辑 文件 ,逻辑 文件 是 用 户 可 见 的 抽象 文件 。 文件 的 逻辑 结构 可 分 为 字符 流 式 无 结构 的 
连续 文件 .记录 式 有 结构 文件 两 大 类 。 其 中 记录 式 文件 又 可 分 为 连续 结构 .多重 结构 、 转 置 
结构 及 顺序 结构 文件 等 。 对 于 记录 式 文件 来 说 ,如 果 用 户 在 存 取 操 作 时 指定 的 参数 是 关键 
字 或 记录 名 的 话 ( 按 关键 字 存 取 ), 有 3 种 常用 的 方法 可 用 来 检索 文件 ,它们 是 线性 检索 法 、 
散 列 法 和 二 分 搜索 法 。 

除了 逻辑 结构 之 外 ,一 个 文件 在 存储 设备 上 按 一 定 的 物理 方式 存放 。 文 件 的 物理 结构 
受 设备 类 型 的 影响 。 例 如 ,磁带 设备 只 适合 连续 存放 和 顺序 存 取 ,而 磁盘 设备 既 适 合 连续 存 
放 , 也 适合 串联 存放 和 索引 存放 。 磁 盘 设 备 上 的 文件 既 可 以 是 顺序 存 取 的 ,也 可 以 是 直接 存 
取 或 按 关键 字 存 取 的 。 

当 用 户 创建 一 个 文件 时 ,首先 要 给 该 文件 分 配 足 够 的 存储 空间 。 存 储 空 间 的 管理 方法 
有 空白 文件 目录 ,空闲 块 甸 和 位 示 图 法 。 比 较 有 影响 的 存储 空间 管理 方法 是 空闲 块 链 中 的 
成 组 链 法 。 

文件 名 或 记录 名 与 物理 地 址 之 间 的 转换 通过 文件 目录 来 实现 。 有 单 级 目录 、 二 级 目录 
和 多 级 目录 几 种 目录 结构 。 二 级 目录 和 多 级 目录 是 为 了 解决 文件 的 重 名 问题 和 提高 搜索 速 
度 而 提出 来 的 。 多 级 目录 构成 文件 树 形 结构 。 另 外 ,为 了 便于 共享 ,把 目录 项 中 存放 的 文件 
说 明 信 息 划分 为 两 部 分 : 文件 内 部 标识 符 和 文件 名 , 存 取 控 制 信息 以 及 结构 信息 等 文件 说 
明 信 息 部 分 。 前 者 的 集合 称 为 符号 文件 表 (SFD) ,后 者 的 集合 称 为 基本 文件 表 (BFD) 。 
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对 文件 的 存 取 控制 是 和 文件 共享 ,保护 和 保密 紧密 相关 的 。 存 取 控 制 可 采用 存 取 控制 


矩阵、 存 取 控制 表 \ 口 令 和 密码 的 方法 进行 存 取 验 证 ,以 确定 用 户 权 限 。 


次 加 
> 六 玫 


go po go po 


外 


最 后 ,本 章 介绍 了 文件 系统 的 使 用 方法 和 文件 系统 的 层次 模型 。 
习 题 


什么 是 文件 和 文件 系统 ? 文件 系统 有 哪些 功能 ? 

文件 一 般 根 据 什 么 分 类 ? 可 以 分 为 哪 几 类 ? 

什么 是 文件 的 逻辑 结构 ?什么 是 记录 ? 

设 文件 的 结构 为 多 重 结构 和 转 置 结 构 的 组 合 , 且 定义 函数 decode(K,x) 和 retrive( 天 ， 

Z) 如 下 : 

函数 decode(K ,x) 为 关键 字 K 的 搜索 函数 。 其 中 K 为 待 搜索 关键 字 ,z 为 顺序 指针 。 

当 被 搜索 文件 为 多 重 结构 时 ,指向 关键 字 天 的 指针 只 有 一 个 , 即 e(K), 此 时 x 二 nil， 

且 decode( 开 ,zz) 返 回 指针 e( 开 )。 当 被 搜索 文件 为 转 置 结 构 时 ,一 般 指 向 关键 字 天 的 

指针 有 7 个 , 即 ea (K),…,e,(K),n 为 包含 关键 字 K 的 记录 个 数 。 此 时 ,车 x 二 nil， 

decode(K ,Xx) 返 回 e(K); 若 二 e,(K), 则 decode(K ,zx) 返 回 nil; 否 则 ,车 x 二 e;(K)， 

1 过 i 过 <n, 则 decode(K,x) 返 回 e; 十 1(K)。 

函数 retrive(K ,zx) 是 记录 搜索 函数 。 其 中 为 指向 关键 字 的 指针 ,x 为 记录 顺序 指 

针 。 如 果 工 二 ni 则 retrive( 天 ,z) 返 回 被 搜索 记录 队列 的 第 一 个 记录 的 逻辑 地 址 ; 若 工 

等 于 该 记录 队列 的 最 后 一 个 记录 的 话 , 则 retrive(K ,zx) 返 回 nil; 和 否则 ,retrive( 天 ,zz) 返 

回 xz 的 下 一 个 记录 的 逻辑 地 址 。 

试问 : 

(1) 如 果 decode(K ,zx) 采 用 线性 搜索 法 ,怎样 描述 decode(K ,zx)? 

(2) 如 果 retrive(K,z) 采 用 二 分 搜索 法 ,应 怎样 排列 记录 队列 ?怎样 描述 聘 数 retrive 
(Kj) 

(3) 设 函 数 search(K) 给 出 含有 关键 字 K 的 所 有 记录 的 逻辑 地 址 , 试 描述 search(K)。 

设 散 列 函 数 h(n) = 二 (676X4 十 26X4s 十 4) (mod D ,一 11,7 为 关键 字 n 的 第 i 个 英文 

字母 序号 。 关 键 字 表 长 为 11 ,关键 字 为 英文 字母 。 先 按 线性 散 列 法 ,再 按 平方 散 列 法 

计算 将 任意 7 个 关键 字 放 入 链表 中 所 用 的 计算 次 数 。 这 里 令 a==2,c 二 1。 

设 关键 字 表 按 英文 字母 顺序 排列 , 且 两 关键 字 项 之 间 的 距离 为 &, 写 出 2 一 3 的 三 分 搜 

文件 的 物理 结构 有 哪 几 种 ? 为 什么 说 串联 文件 结构 不 适 于 随机 存 取 ? 

设 索 引 表 长 度 为 13 ,其 中 0 一 9 项 为 直接 寻 址 方式 ,后 3 项 为 间接 寻 址 方式 , 试 描述 出 

给 定 文件 长 度 n( 块 数 ) 后 的 索引 方式 寻 址 算法 。 

常用 的 文件 存储 设备 的 管理 方法 有 哪些 ? 试 述 主 要 优 缺 点 。 


10 ，” 试 述 成 组 链 法 的 基本 原理 ,并 描述 成 组 链 法 的 分 配 与 释放 过 程 。 


.11 什么 是 文件 目录 ? 文件 目录 中 包含 哪些 信息 ? 
.12 二 级 目录 和 多 级 目录 的 好 处 是 什么 ? 符号 文件 目录 表 和 基本 文件 目录 表 是 二 级 目 


录 吗 ? 
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8.13 文件 存 取 控 制 方式 有 哪 几 种 ? 试 比较 它们 各 自 的 优 缺 点 。 

8.14 设 文件 SQRT 由 连续 结构 的 定 长 记录 组 成 ,每 个 记录 的 长 度 为 500B, 每 个 物理 块 长 
1000B, 且 物理 结构 也 为 连续 结构 和 采用 直接 存 取 方 式 ; 试 按照 图 8. 23 所 示 的 文件 
系统 模型 , 写 出 系统 调用 Read(SQRT,5,15000) 的 各 层 执行 结果 。 其 中 , SQRT 为 
文件 名 ,5 为 记录 号 ,15000 为 内 存 地 址 。 
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第 9 章 设备 管理 


设备 管理 是 操作 系统 的 重要 组 成 部 分 之 一 。 本 章 主要 讨论 设备 管理 的 基本 概念 ,包括 
中 断 \ 缓 冲 、 设 备 分 配 和 控制 等 。 


9.1 引 证 


9.1.1 设备 的 类 别 


在 计算 机 系统 中 ,除了 CPU 和 内 存 之 外 ,其 他 的 大 部 分 硬 设 备 称 为 外 部 设备 。 它 包括 
常用 的 输入 输出 设备 ,外 存 设 备 以 及 终端 设备 等 。 这 些 设备 种 类 繁多 ,特性 各 异 ,操作 方式 
的 区 别 也 很 大 ,从 而 使 得 操作 系统 的 设备 管理 变 得 十 分 复杂 。 本 节 先 从 系统 管理 的 角度 将 
各 种 设备 进行 简单 的 分 类 ,然后 再 介绍 设备 管理 的 主要 功能 与 任务 。 

早期 的 计算 机 系统 由 于 速度 慢 ,应 用 面 罕 ,外 部 设备 主要 以 纸 带 ,卡片 等 作为 输入 输出 
介质 ,相应 的 设备 管理 程序 也 比较 简单 。 

进入 20 世纪 80 年 代 以 来 ,由 于 个 人 计算 机 、 工 作 站 以 及 计算 机 网 络 系统 等 的 发 展 , 外 
部 设备 开始 走向 多 样 化 复杂 化 和 智能 化 。 例 如 ,在 有 的 网 络 卡 中 就 装 有 自己 的 CPU ,以 处 
理 网 络 上 信息 的 输入 输出 。 再 者 ,除了 硬件 设备 之 外 ,以 某 种 硬件 设备 为 基础 的 虚拟 设备 和 
仿真 设备 技术 也 得 到 了 广泛 应 用 。 例 如 , 虚 终 端 技术 和 仿真 终端 技术 等 。 实 际 上 ,近年 来 最 
为 流行 的 窗口 系统 中 的 X Window 等 都 是 作为 一 种 设备 和 操作 系统 相连 的 。 这 使 得 设备 管 
理 变 得 越 来 越 复杂 化 。 限 于 篇 幅 , 本 章 只 能 介绍 设备 管理 的 基本 原理 和 方法 。 掌 握 了 这 些 
基本 原理 和 方法 ,读者 在 了 解 具体 的 设备 管理 系统 时 就 会 容易 得 多 。 

首先 介绍 设备 的 分 类 。 按 设备 的 使 用 特性 可 分 为 存储 设备 、 输 入 输出 设备 ,终端 设备 以 
及 脱 机 设备 等 ,如 图 9. 1 所 示 。 

另外 , 按 设备 的 从 属 关系 ,可 把 设备 划分 为 系统 设备 和 用 户 设备 。 系 统 设 备 是 指 那些 在 
操作 系统 生成 时 就 已 配置 好 的 各 种 标准 设备 ,例如 键盘 .打印 机 以 及 文件 存储 设备 等 。 而 用 
户 设 备 则 是 那些 在 系统 生成 时 没有 配置 ,而 由 用 户 自己 安装 配置 后 由 操作 系统 统一 管理 的 
设备 。 例 如 ,网 络 系统 中 的 各 种 网 板 、 实 时 系统 中 的 A/D 和 D/A 变换 器 以 及 图 像 处 理 系统 
的 图 像 设备 等 。 

对 设备 分 类 的 目的 在 于 简化 设备 管理 程序 。 由 于 设备 管理 程序 是 和 硬件 打交道 的 , 因 
此 ,不 同 的 设备 硬件 对 应 于 不 同 的 管理 程序 。 不 过 ,对 于 同类 设备 来 说 ,由 于 设备 的 硬件 特 
性 十 分 相似 ,从 而 可 以 利用 相同 的 管理 程序 或 只 需 做 很 少 的 修改 即 可 。 

除了 上 述 分 类 方法 之 外 ,在 有 的 系统 中 还 按 信息 组 织 方式 来 划分 设备 。 例 如 ,UNIX 系 
统 就 把 外 部 设备 划分 为 字符 设备 和 块 设备 。 键 盘 、 终 端 和 打印 机 等 以 字符 为 单位 组 织 和 处 
理 信息 的 设备 被 称 为 字符 设备 ;而 磁盘 、 磁 带 等 以 字符 块 为 单位 组 织 和 处 理 信息 的 设备 被 称 
为 块 设备 。 
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[站 人 -软盘 

一 一 存储 设备 一 硬盘 

| 一 其 他 ( 磁 鼓 、 光 盘 等 ) 

| 一 键盘 

| 一 打印 机 

一 显示 器 
上 图形 输 入 输出 设备 

| 输入 输出 设备 一 | 一 图 像 输入 输出 设备 

一 绘图 机 

外 部 设备 一 一 | 一 声音 输入 输出 设备 

| 一 网 络 通信 板 

一 其 他 


一 会话 型 
一 通用 终端 一 十 一 批 处 理 型 
一 一 终端 设备 一 | 一 智能 终端 


一 一 一 脱 机 设备 
图 9.1 按 使 用 特性 对 外 部 设备 的 分 类 


9.1.2 设备 管理 的 功能 和 任务 


设备 管理 是 对 计算 机 输入 输出 系统 的 管理 ,这 是 操作 系统 中 最 具有 和 多样 性 和 复杂 性 的 
部 分 。 其 主要 任务 如 下 : 

(1) 选择 和 分 配 输入 输出 设备 以 便 进行 数据 传输 操作 。 

(2) 控制 输入 输出 设备 和 CPU( 或 内 存 ) 之 间 交 换 数 据 。 

(3) 为 用 户 提供 一 个 友好 的 透明 接口 ,把 用 户 和 设备 硬件 特性 分 开 , 使 得 用 户 在 编制 应 
用 程序 时 不 必 涉 及 具体 设备 ,系统 按 用 户 要求 控 制 设备 工作 。 另 外 ,这 个 接口 还 为 新 增加 的 
用 户 设备 提供 一 个 和 系统 核心 相连 接 的 人口 ,以便 用 户 开 发 新 的 设备 管理 程序 。 

(4) 提高 设备 和 设备 之 间 、CPU 和 设备 之 间 ,以 及 进程 和 进程 之 间 的 并 行 操 作 度 ,以 使 
操作 系统 获得 最 佳 效率 。 

为 了 完成 上 述 主要 任务 ,设备 管理 程序 一 般 要 提供 下 述 功能 : 

(1) 提供 和 进程 管理 系统 的 接口 。 当 进程 要 求 设备 资源 时 ,该 接口 将 进程 要 求 转 达 给 
设备 管理 程序 。 

(2) 进行 设备 分 配 。 按 照 设备 类 型 和 相应 的 分 配 算法 把 设备 和 其 他 有 关 的 硬件 分 配给 
请 求 该 设备 的 进程 ,并 把 未 分 配 到 所 请 求 设备 或 其 他 有 关 硬 件 的 进程 放 入 等 待 队 列 。 

(3) 实现 设备 和 设备 ,设备 和 CPU 等 之 间 的 并 行 操作 。 这 需要 有 相应 的 硬件 支持 。 除 
了 装 有 控制 状态 寄存 器 .数据 缓冲 寄存 器 等 的 控制 器 之 外 ,对 应 于 不 同 的 输入 输出 (I/O) 控 
制 方式 ,还 需要 有 DMA(Directed Memory Access) 通 道 等 硬件 。 从 而 ,在 设备 分 配 程序 根 
据 进程 要 求 分 配 了 设备 .控制 器 和 通道 (或 DMA) 等 硬件 之 后 ,通道 (或 DMA) 将 自动 完成 
设备 和 内 存 之 间 的 数据 传送 工作 ,从 而 完成 并 行 操作 的 任务 。 在 没有 通道 (或 DMA) 的 系 
统 里 , 则 由 设备 管理 程序 利用 中 断 技术 来 完成 上 述 并 行 操作 。 

(4) 进行 缓冲 区 管理 。 一 般 来 说 ,CPU 的 执行 速度 和 访问 内 存 速度 都 比较 高 ,而 外 部 
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设备 的 数据 流通 速度 则 低 得 多 (例如 键盘 ) ,为 了 减少 外 部 设备 和 内 存 与 CPU 之 间 的 数据 
速度 不 匹配 的 问题 ,系统 中 一 般 设 有 缓冲 区 (器 ) 来 暂 放 数 据 。 设 备 管理 程序 负责 进行 缓冲 
区 分 配 、 释 放 及 有 关 的 管理 工作 。 

下 面 ,首先 介绍 各 种 输入 输出 的 控制 方式 ,然后 再 介绍 缓冲 区 管理 \ 中 断 、 陷 阱 以 及 软 中 
断 等 基本 概念 。 在 此 基础 上 ,再 介绍 设备 分 配 原 则 及 有 关 分 配 算法 ,最 后 介绍 I/O 进程 的 
概念 及 设备 驱动 过 程 。 


9.2 数据 传送 控制 方式 


设备 管理 的 主要 任务 之 一 是 控制 设备 和 内 存 或 CPU 之 间 的 数据 传送 ,本 节 介 绍 几 种 
常用 的 数据 传送 控制 方式 。 

选择 和 衡量 控制 方式 有 如 下 几 条 原则 : 

(1) 数据 传送 速度 足够 高 ,能 满足 用 户 的 需要 但 又 不 丢失 数据 。 

(2) 系统 开销 小 ,所 需 的 处 理 控 制程 序 少 。 

(3) 能 充分 发 挥 硬件 资源 的 能 力 ,使 得 1/O 设备 尽量 忙 , 而 CPU 等 待 时 间 少 。 由 计算 
机 原理 课 , 已 经 知道 ,为 了 控制 LO 设备 和 内 存 之 间 的 数据 交换 ,每 台 外 围 设备 都 是 按照 一 
定 的 规律 编码 的 。 而 且 , 设 备 和 内 存 与 CPU 之 间 有 相应 的 硬件 接口 支持 同步 控制 、. 设 备 选 
择 以 及 中 断 控制 等 。 因 此 ,假定 本 节 的 数据 传送 控制 方式 都 是 基于 这 些 硬 件 基础 的 ,从 而 不 
再 讨论 有 关 硬 件 部 分 。 

外 围 设 备 和 内 存 之 间 的 常用 数据 传送 控制 方式 有 4 种 : 

(1) 程序 直接 控制 方式 ; 

(2) 中 断 控制 方式 ; 

(3) DMA 方式 ; 

(4) 通道 方式 。 

下 面 分 别 给 予 介 绍 。 


9.2.1 程序 直接 控制 方式 


程序 直接 控制 方式 (programmed direct control) 就 是 由 用 户 进程 来 直接 控制 内 存 或 
CPU 和 外 围 设备 之 间 的 信息 传送 。 这 种 方式 的 控制 者 是 用 户 进 程 。 当 用 户 进程 需要 数据 
时 , 它 通 过 CPU 发 出 启动 设备 准备 数据 的 启动 命令 Start, 然 后 ,用 户 进程 进入 测试 等 待 状 
态 。 在 等 待 时 间 内 ,CPU 不 断 地 用 一 条 测试 指令 检查 描述 外 围 设 备 的 工作 状态 的 控制 状态 
寄存 器 。 而 外 围 设备 只 有 将 数据 传送 的 准备 工作 做 好 之 后 , 才 将 该 寄存 器 置 为 完成 状态 。 
从 而 , 当 CPU 检测 到 控制 状态 寄存 器 为 完成 状态 ,也 就 是 该 寄存 器 发 出 Done 信号 之 后 , 设 
备 开始 往 内 存 或 CPU 传送 数据 。 反 之 , 当 用 户 进程 需要 向 设备 输出 数据 时 ,也 必须 同样 发 
启动 命令 启动 设备 和 等 待 设备 准备 好 之 后 才能 输出 数据 。 除 了 控制 状态 寄存 器 之 外 ,在 
1/0 控制 器 中 还 有 一 类 称 为 数据 缓冲 寄存 器 的 寄存 器 。 在 CPU 与 外 围 设备 之 间 传 送 数据 
时 ,输入 设备 每 进行 一 次 操作 ,首先 把 所 输入 的 数据 送 入 该 寄存 器 ,然后 ,CPU 再 把 其 中 的 
数据 取 走 。 反 之 , 当 CPU 输出 数据 时 ,也 是 先 把 数据 输出 到 该 寄存 器 之 后 ,再 由 输出 设备 
将 其 取 走 。 只 有 数据 装 入 该 寄存 器 之 后 ,控制 状态 寄存 器 的 值 才 会 发 生变 化 。 程 序 直接 控 
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制 方式 的 控制 流程 如 图 9. 2 所 示 。 


外 围 设备 CPU 
1 
接收 到 Start 命 令 
1 
做 接收 或 发 送 数据 准备 
bp 
一 < 一 准备 完毕 ? 于 
+ 是 等 待 
标志 触发 器 置 Done | 
1 执行 下 条 指令 
等 待 CPU 来 的 下 条 指令 开始 数据 传送 
1 1 
(a) (b) 


图 9.2 程序 直接 控制 方式 


程序 直接 控制 方式 虽然 控制 简单 ,也 不 需要 多 少 硬 件 支 持 , 但 是 ,程序 直接 控制 方式 明 
显 地 存在 下 述 缺 点 : 

(1) CPU 和 外 围 设备 只 能 串 行 工 作 。 由 于 CPU 的 处 理 速度 要 大 大 高 于 外 围 设备 的 数 
据 传 送 和 处 理 速度 ,所 以 ,CPU 的 大 量 时 间 都 处 于 等 待 和 空闲 状态 。 这 使 得 CPU 的 利用 率 


大 大 降低 。 
(2) CPU 在 一 段 时 间 内 只 能 和 一 台 外 围 设备 交换 数据 信息 ,从 而 不 能 实现 设备 之 间 的 
并 行 工作 。 


(3) 由 于 程序 直接 控制 方式 依靠 测试 设备 标志 触发 器 的 状态 位 来 控制 数据 传送 ,因此 
无 法 发 现 和 处 理由 于 设备 或 其 他 硬件 所 产生 的 错误 。 所 以 ,程序 直接 控制 方式 只 适用 于 那 
些 CPU 执行 速度 较 慢 , 而 且 外 围 设备 较 少 的 系统 。 


9.2.2 中 断 方式 


为 了 减少 程序 直接 控制 方式 中 的 CPU 等 待 时 间 以 及 提高 系统 的 并 行 工 作 程 度 ,中 断 
(interrupt) 方 式 被 用 来 控制 外 围 设备 和 内 存 与 CPU 之 间 的 数据 传送 。 这 种 方式 要 求 CPU 
与 设备 (或 控制 器 ) 之 间 有 相应 的 中 断 请 求 线 ,而 且 在 设备 控制 右 的 控制 状态 寄存 器 有 相应 
的 中 断 允许 位 。 中 断 方式 的 传送 结构 如 图 9. 3 所 示 。 从 而 ,数据 的 输入 可 按 如 下 步骤 操作 。 

(1) 进程 需要 数据 时 ,通过 CPU 发 出 Start 指令 启动 外 围 设备 准备 数据 。 该 指令 同时 
还 将 控制 状态 寄存 器 中 的 中 断 允 许 位 打开 ,以 便 在 需要 时 ,中断 程序 可 以 被 调用 执行 。 

(2) 在 进程 发 出 指令 启动 设备 之 后 ,该 进程 放弃 处 理 机 ,等 待 输入 完成 。 从 而 ,进程 调 
度 程 序 调 度 其 他 就 绪 进 程 占据 处 理 机 。 

(3) 当 输 入 完成 时 ,IO 控制 器 通过 中 断 请 求 线 向 CPU 发 出 中 断 信号 。CPU 在 接收 到 
中 断 信 号 之 后 ,转向 预先 设计 好 的 中 断 处 理 程序 对 数据 传送 工作 进行 相应 的 处 理 。 

(4) 在 以 后 的 某 个 时 刻 , 进 程 调度 程序 选中 提出 请 求 并 得 到 了 数据 的 进程 ,该 进程 从 约 
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1 VO 控制 器 | 地 址 线 py 
i 控制 线 
stat || | 
IO 设备 7 一 一 =| IO 控制 器 内 存 
n 
启动 位 2 中 断 位 
六 ps 
| |] 控制 状态 寄存 器 。”--- : 信号 线 
数据 缓冲 寄存 器 


图 9.3 中 断 控制 方式 的 传送 结构 


定 的 内 存 特定 单元 中 取出 数据 继续 工作 。 
中 断 控制 方式 的 处 理 过 程 可 由 图 9.4 表示 。 
设备 CPU 
接收 到 CPU 发 来 的 向 设备 发 Start 指 令 
Start 指 令 将 中 断 人 允许 位 置 1 
准备 数据 并 将 其 置 入 调整 程序 调度 其 他 
缓冲 寄存 器 进程 
其 他 进程 执行 


缓冲 寄存 器 满 吗 ? 


是 
TO TPRT 政 到 中 断 信号 了 吗 ? 
1 
中 断 处 理 
被 中 断 进 程 执行 


图 9.4 中 断 控制 方式 的 处 理 过 程 


读者 可 以 仿照 上 面 的 过 程 ,描述 输出 情况 下 的 中 断 控制 方式 的 处 理 过 程 。 由 图 9. 4 可 
以 看 出 , 当 CPU 发 出 启动 设备 和 人 允许 中 断 指令 之 后 , 它 没有 像 程 序 直 接 控 制 方式 那样 循环 
测试 状态 控制 寄存 器 的 状态 是 否 已 处 于 Done。 反 之 ,CPU 已 被 调度 程序 分 配给 其 他 进程 
在 另外 的 进程 上 下 文中 执行 。 当 设备 将 数据 送 入 缓冲 寄存 器 并 发 出 中 断 信号 之 后 ,CPU 接 
收 中 断 信 号 进行 中 断 处 理 。 显 然 ,CPU 在 另外 的 进程 上 下 文中 执行 时 ,也 可 以 发 启动 不 同 
设备 的 启动 指令 和 允许 中 断 指令 ,从 而 做 到 设备 与 设备 间 的 并 行 操作 以 及 设备 和 CPU 间 
的 并 行 操作 。 
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不 过 ,尽管 中 断 方式 与 程序 直接 控制 方式 相 比 ,使 CPU 的 利用 率 大 大 提高 且 能 支持 多 
道 程序 和 设备 的 并 行 操 作 , 但 仍然 存在 着 许多 问题 。 首 先 , 由 于 在 IO 控制 器 的 数据 缓冲 
寄存 器 装 满 数据 之 后 将 会 发 生 中 断 ,而 且 数 据 缓冲 寄存 器 通常 较 小 ,因此 ,在 一 次 数据 传送 
过 程 中 ,发 生 中 断 的 次 数 较 多 。 这 将 耗 去 大 量 的 CPU 处 理 时 间 。 另 外 ,现代 计算 机 系统 通 
常 配置 有 各 种 各 样 的 外 围 设备 。 如 果 这 些 设 备 通 过 中 断 处 理 方式 进行 并 行 操作 , 则 由 于 中 
断 次 数 的 急剧 增加 而 造成 CPU 无 法 响应 中 断 和 出 现 数据 丢失 现象 。 另 外 ,在 中 断 控制 方 
式 时 ,我 们 都 是 假定 外 围 设备 的 速度 非常 低 , 而 CPU 处 理 速度 非常 高 。 也 就 是 说 , 当 设备 
把 数据 放 入 数据 缓冲 寄存 器 并 发 出 中 断 信号 之 后 ,CPU 有 足够 的 时 间 在 下 一 个 (组 ) 数 据 进 
和 数据 缓冲 寄存 器 之 前 取 走 这 些 数据 。 如 果 外 围 设备 的 速度 也 非常 高 , 则 可 能 造成 数据 组 
冲 寄 存 器 的 数据 由 于 CPU 来 不 及 取 走 而 丢失 。DMA 方式 和 通道 方式 不 会 造成 上 述 问题 。 


9.2.3 DMIA 方式 


DMA(Direct Memory Access) 方 式 又 称 直接 存 取 方式 。 其 基本 思想 是 在 外 围 设 备 和 
内 存 之 间 开 辟 直 接 的 数据 交换 通路 。 在 DMA 方式 中 ,1/O 控制 器 具有 比 中 断 方式 和 程序 
直接 控制 方式 时 更 强 的 功能 。 另 外 ,除了 控制 状态 寄存 器 和 数据 缓冲 寄存 器 之 外 ,DMA 控 
制 器 中 还 包括 传送 字 节 计数 器 .内 存 地 址 寄存 器 等 。 这 是 因为 DMA 方式 窃取 或 挪用 CPU 
的 一 个 工作 周期 把 数据 缓冲 寄存 器 中 的 数据 直接 送 到 内 存 地 址 寄存 器 所 指向 的 内 存 区 域 中 
的 缘故 。 

从 而 ,DMA 控制 器 可 用 来 代替 CPU 控制 内 存 和 设备 之 间 进 行 成 批 的 数据 交换 。 批 量 
数据 (数据 块 ) 的 传送 由 计数 器 逐个 计数 ,并 由 内 存 地 址 寄存 器 确定 内 存 地 址 。 除 了 在 数据 
块 传送 开始 时 需要 CPU 的 启动 指令 和 在 整个 数据 块 传送 结束 时 需 发 中 断 通知 CPU 进行 
中 断 处 理 之 外 ,不 再 像 中 断 控制 方式 时 那样 需要 CPU 的 频繁 干预 。DMA 方式 的 结构 如 图 
9.5 所 示 。 


IO 设备 一 ~| DMA 控 制 器 K 寻 一 一 一 > 内 存 


控制 状态 寄存 器 


数据 缓冲 寄存 器 
传送 字 节 数 计数 器 
内 存 地 址 寄存 器 
图 9.5 DMA 方式 的 传送 结构 


DMA 方式 的 数据 输入 处 理 过 程 如 下 : 

(1) 当 进 程 要 求 设备 输入 数据 时 ,CPU 把 准备 存放 输入 数据 的 内 存 始 址 以 及 要 传送 的 
字 节 数 分 别 送 入 DMA 控制 器 中 的 内 存 地 址 寄存 器 和 传送 字 节 数 计数 器 ,另外 ,还 把 控制 状 
态 寄存 器 中 的 中 断 允 许 位 和 启动 位 置 1, 从 而 启动 设备 开始 进行 数据 输入 。 


i 


(2) 发 出 数据 要 求 的 进程 进入 等 待 状态 ,进程 调度 程序 调度 其 他 进程 占据 CPU。 

(3) 输入 设备 不 断 地 挪用 CPU 工作 周期 ,将 数据 缓冲 寄存 器 中 的 数据 源源 不 断 地 写 人 
内 存 , 直 到 所 要 求 的 字 节 全 部 传送 完毕 。 

(4) DMA 控制 器 在 传送 字 节 数 完成 时 通过 中 断 请 求 线 发 出 中 断 信号 ,CPU 在 接收 到 
中 断 信号 后 转 中 断 处 理 程序 进行 善后 处 理 。 

(5) 中 断 处 理 结束 时 ,CPU 返回 被 中 断 进程 处 执行 或 被 调度 到 新 的 进程 上 下 文 环境 中 


执行 。 
DMA 方式 的 数据 传送 处 理 过 程 如 图 9.6 所 示 。 
设备 CPU 
DMA 控制 器 发 Start 指 令 
接收 到 Start 指 令 内 存 地 址 一 内 存 地 址 寄存 器 
一 一 传送 字 节 数 一 传 送 字 节 计数 
器 允许 中 断 位 与 启动 位 置 1 
启动 设备 准备 数据 
当前 进程 等 待 ， 调 度 
数据 入 数据 程序 调度 其 他 进程 
缓冲 寄存 器 
缓冲 寄存 器 的 被 调度 进程 执行 
内 容 入 内 存 
-一 
改变 传送 字 节 数 
计数 器 与 内 存 地 址 
寄存 器 的 内 容 


转 中 断 处 理 


发 中 断 信号 
停止 VO 操作 


图 9.6 DMA 方式 的 数据 传送 处 理 过 程 


由 图 9.6 可 以 看 出 ,DMA 方式 与 中 断 方式 的 一 个 主要 区 别 是 ,中 断 方式 时 是 在 数据 组 
冲 寄存 器 满 之 后 发 中 断 要 求 CPU 进行 中 断 处 理 , 而 DMA 方式 则 是 在 所 要 求 传送 的 数据 块 
全 部 传送 结束 时 要 求 CPU 进行 中 断 处 理 。 这 就 大 大 减少 了 CPU 进行 中 断 处 理 的 次 数 。 
男 一 个 主要 区 别 是 ,中 断 方式 的 数据 传送 是 在 中 断 处 理 时 由 CPU 控制 完成 的 ,而 DMA 方 
式 是 在 DMA 控制 器 的 控制 下 不 经 过 CPU 控制 完成 的 。 这 就 排除 了 因 并 行 操作 设备 过 多 
时 CPU 来 不 及 处 理 或 因 速 度 不 匹配 而 造成 数据 丢失 等 现象 。 

不 过 ,DMA 方式 仍 存在 着 一 定 的 局 限 性 。 首 先 ,DMA 方式 对 外 围 设备 的 管理 和 某 些 
操作 仍 由 CPU 控制 。 在 大 中 型 计算 机 中 ,系统 所 配置 的 外 设 种 类 越 来 越 多 ,数量 也 越 来 越 
大 ,因而 ,对 外 围 设备 的 管理 的 控制 也 就 愈 来 愈 复杂 。 多 个 DMA 控制 器 的 同时 使 用 显然 会 
引起 内 存 地 址 的 冲突 并 使 得 控制 过 程 进一步 复杂 化 。 同 时 ,多 个 DMA 控制 器 的 同时 使 用 
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也 是 不 经 济 的 。 因 此 ,在 大 中 型 计算 机 系统 中 (近年 来 甚至 在 那些 要 求 W/O 能 力 强 的 微机 
系统 中 ,例如 在 Compaq 的 System pro386 系列 微机 系统 中 ) ,除了 设置 DMA 器 件 之 外 ,还 
设置 专门 的 硬件 装置 一 一 通道 。 下 面 介 绍 通 道 控制 方式 。 


9.2.4 通道 控制 方式 


通道 控制 (channel control) 方 式 与 DMA 方式 相似 ,也 是 一 种 以 内 存 为 中 心 ,实现 设备 
和 内 存 直接 交换 数据 的 控制 方式 。 在 DMA 方式 中 ,数据 的 传送 方向 存放 数据 的 内 存 始 址 
以 及 传送 的 数据 块 长 度 等 都 由 CPU 控制 ,而 在 通道 方式 中 ,这 些 都 由 专 管 输入 输出 的 硬 
件 一 一 通道 来 进行 控制 。 另 外 ,与 DMA 方式 时 每 台 设 备至 少 一 个 DMA 控制 器 相 比 ,通道 
控制 方式 可 以 做 到 一 个 通道 控制 多 台 设 备 与 内 存 进 行 数据 交换 ,从 而 ,通道 方式 进一步 减轻 
了 CPU 的 工作 负担 和 增加 了 计算 机 系统 的 并 行 工 作 程度 。 

由 于 通道 是 一 个 专 管 输入 输出 操作 控制 的 硬件 ,有 必要 更 进一步 完整 地 描述 一 下 通道 
的 定义 : 通道 是 一 个 独立 于 CPU 的 专 管 输入 输出 控制 的 处 理 机 , 它 控制 设备 与 内 存 直接 进 
行 数据 交换 。 它 有 自己 的 通道 指令 ,这 些 通 道 指令 由 CPU 启动 ,并 在 操作 结束 时 向 CPU 
发 中 断 信号 。 

通道 的 定义 给 出 了 通道 控制 方式 的 基本 思想 。 在 通道 控制 方式 中 ,I1/O 控制 器 中 没有 
传送 字 节 计数 器 和 内 存 地 址 寄存 器 ;但 多 了 通道 设备 控制 器 和 指令 执行 机 构 。 在 通道 方式 
下 ,CPU 只 需 发 出 启动 指令 ,指出 通道 相应 的 操作 和 I/O 设备 ,该 指令 就 可 启动 通道 并 使 该 
通道 从 内 存 中 调 出 相应 的 通道 指令 执行 。 

通道 指令 一 般 包含 被 交换 数据 在 内 存 中 应 占据 的 位 置 、 传 送 方向 ,数据 块 长 度 以 及 被 控 
制 的 1/O 设备 的 地 址 信息 、 特 征 信 息 ( 例 如 是 磁带 设备 还 是 磁盘 设备 ) 等 ,通道 指令 在 通道 
中 没有 存储 部 件 时 存放 在 内 存 中 。 

通道 指令 的 格式 一 般 由 操作 码 ( 读 、 写 或 控制 ) .计数 段 ( 数 据 块 长 度 ) 以 及 内 存 地 址 段 和 
结束 标志 等 组 成 。 通 道 指令 在 进程 要 求 数 据 时 由 系统 自动 生成 。 例 如 : 

write 0 0 250 1850 

write 1 1 250 720 


是 两 条 把 一 个 记录 的 500 个 字符 分 别 写 和 人 从 内 存 地 址 1850 开始 的 250 个 单元 和 从 内 存 地 
址 720 开始 的 250 个 单元 中 。 其 中 假定 write 操作 码 后 的 1 是 通道 指令 结束 标志 ,而 另 一 个 
1 则 是 记录 结束 标志 。 该 指令 中 省 略 了 设备 号 和 设备 特征 。 

另外 ,一 个 通道 可 以 以 分 时 方式 同时 执行 几 个 通道 指令 程序 。 按 照 信息 交换 方式 的 不 
同 ,一 个 系统 中 可 设立 3 种 类 型 的 通道 , 即 字 节 多 路 通道 .数组 多 路 通道 和 选择 通道 。 由 这 
3 种 通道 组 成 的 数据 传送 控制 结构 如 图 9.7 所 示 。 

字 节 多 路 通道 以 字 节 为 单位 传送 数据 , 它 主要 用 来 连接 大 量 的 低速 设备 ,如 终端 .打印 
机 等 。 

数组 多 路 通道 以 块 为 单位 传送 数据 , 它 具 有 传送 速率 高 和 能 分 时 操作 不 同 的 设备 等 优 
点 。 数 组 多 路 通道 主要 用 来 连接 中 速 块 设备 ,如 磁带 机 等 。 

数组 多 路 通道 和 字 节 多 路 通道 都 可 以 分 时 执行 不 同 的 通道 指令 程序 。 但 是 选择 通道 一 
次 只 能 执行 一 个 通道 指令 程序 ,所 以 选择 通道 一 次 只 能 控制 一 台 设 备 进行 IO 操作。 不 
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CPU 内 存 
4 看 了 让 > 总线 
字 节 数组 
多 路 通道 | 多 路 通道 | 选择 通道 
终端 一 1O 控制 器 | | Yo 控制 器 | 磁带 机 1O 控 制 器 | 磁盘 机 
终端 一 TO 控制 器 
终端 一 1O 控制 器 | | vo 控制 器 | 磁带 机 VO 控制 器 | 磁盘 机 


图 9.7 通道 方式 的 数据 传送 结构 


过 ,选择 通道 具有 传送 速度 高 的 特点 ,因而 它 被 用 来 连接 高 速 外 部 设备 ,并 以 块 为 单位 成 批 
传送 数据 。 受 选择 通道 控制 的 外 设 有 磁盘 机 等 。 

通道 控制 方式 的 数据 输入 处 理 过 程 可 描述 如 下 : 

(1) 当 进 程 要 求 设备 输入 数据 时 ,CPU 发 Start 指令 指明 W/O 操作 ,设备 号 和 对 应 
(2) 对 应 通道 接收 到 CPU 发 来 的 启动 指令 Start 之 后 ,把 存放 在 内 存 中 的 通道 指令 程 
序 读 出 ,设置 对 应 设备 的 IO 控制 器 中 的 控制 状态 寄存 器 。 

(3) 设备 根据 通道 指令 的 要 求 , 把 数据 送 往 内 存 中 的 指定 区 域 。 

(4) 若 数 据 传送 结束 ,1/O 控制 器 通过 中 断 请 求 线 发 中 断 信号 ,请 求 CPU 做 中 断 处 理 。 

(5) 与 DMA 方式 时 相同 , 即 中 断 处 理 结束 后 CPU 返回 被 中 断 进 程 处 继续 执行 。 

在 (1) 中 要 求 数据 的 进程 只 有 在 调度 程序 选中 它 之 后 ,才能 对 所 得 到 的 数据 进行 加 工 
处 理 。 

读者 可 以 仿照 DMA 方式 的 CPU 和 设备 的 处 理 过 程 图 ( 见 图 9.6) 画 出 通道 控制 方式 
的 CPU 和 设备 的 处 理 流程 图 。 

另外 ,在 许多 情况 下 ,人 们 可 从 CPU 执行 的 角度 描述 中 断 控制 方式 .DMA 方式 或 通道 
控制 方式 的 控制 处 理 过 程 。 作 为 一 个 例子 ,这 里 给 出 通道 控制 方式 的 描述 过 程 。 


Channel control procedure: 
repeat 
IR<-M[pc] 
Pe*pe+1 
execute (IR) 
if require accessing with I/O Device 
then Command (I/O operation,Address of I/O device,channel) fi 
if I/O Done interrupt 
then Call interrupt processing control fi 
until machine halt 
Interrupt processing control procedure 
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其 中 ,IR 代表 指令 寄存 器 ,pc 代表 程序 计数 器 ,而 五 则 表示 让 …then… 条 件 语 句 的 结 
束 。 关 于 interrupt processing control 部 分 ,在 9. 3 节 中 将 进一步 讨论 ,这 里 暂时 不 做 介绍 。 


9.3 中 断 技 术 


从 9.2 节 可 以 看 出 ,除了 程序 直接 控制 方式 之 外 ,无 论 是 中 断 控制 方式 .DMA 方式 还 
是 通道 控制 方式 ,都 需 在 设备 和 CPU 之 间 进 行 通信 ,由 设备 向 CPU 发 中 断 信 号 之 后 ,CPU 
接收 相应 的 中 断 信号 进行 处 理 。 这 几 种 方式 的 区 别 只 是 中 断 处 理 的 次 数 、 数 据 传送 方式 以 
及 控制 指令 的 执行 方式 等 。 在 计算 机 系统 中 ,除了 上 述 I/O 中 断 之 外 ,还 存在 着 许多 其 他 
的 突 发 事件 ,例如 电源 掉 电 .程序 出 错 等 ,这 些 也 会 发 出 中 断 信和 号 通知 CPU 做 相应 的 处 理 。 
本 节 进 一 步 讨 论 中 断 问 题 。 


9.3.1 中 断 的 基本 概念 


中 断 (Cinterrupt) 是 指 计算 机 在 执行 程序 期 间 , 系 统 内 发 生 任何 非 寻常 的 或 非 预期 的 急 
需 处 理事 件 ,使 得 CPU 和 暂时 中 断 当前 正在 执行 的 程序 而 转 去 执行 相应 的 事件 处 理 程 序 , 待 
处 理 完 毕 后 又 返回 原来 被 中 断 处 继续 执行 或 调度 新 的 进程 执行 的 过 程 。 引 起 中 断 发 生 的 事 
件 被 称 为 中 断 源 。 中 断 源 向 CPU 发 出 的 请 求 中 断 处 理 信号 称 为 中 断 请 求 ,而 CPU 收 到 中 
断 请 求 后 转 相 应 的 事件 处 理 程序 称 为 中 断 响应 。 

在 有 些 情 况 下 ,尽管 产生 了 中 断 源 和 发 出 了 中 断 请 求 ,但 CPU 内 部 的 处 理 机 状态 字 
(PSW) 的 中 断 允许 位 已 被 清除 ,从 而 不 允许 CPU 响应 中 断 。 这 种 情况 称 为 禁止 中 断 。 
CPU 禁止 中 断后 只 有 等 到 PSW 的 中 断 允 许 位 被 重新 设置 后 才能 接收 中 断 。 禁 止 中 断 也 称 
为 关中 断 ,PSW 的 中 断 允 许 位 的 设置 也 被 称 为 开 中 断 。 由 计算 机 原理 课 可 知 中 断 请 求 , 关 
中 断 和 开 中 断 等 都 是 由 硬件 实现 的 。 

开 中 断 和 关中 断 是 为 了 保证 某 些 程序 执行 的 原子 性 。 

除了 禁止 中 断 的 概念 之 外 ,还 有 一 个 比较 常用 的 概念 是 中 断 屏 项 。 中 断 屏蔽 是 指 在 中 
断 请 求 产 生 之 后 ,系统 用 软件 方式 有 选择 地 封锁 部 分 中 断 而 允许 其 余部 分 的 中 断 仍 能 得 到 
响应 。 

中 断 屏蔽 是 通过 每 一 类 中 断 源 设置 一 个 中 断 屏 项 触发 器 来 屏蔽 它们 的 中 断 请 求 而 实现 
的 。 不 过 ,有 些 中 断 请 求 是 不 能 屏蔽 甚至 不 能 禁止 的 ,也 就 是 说 ,这 些 中 断 具 有 最 高 优先 级 。 
不 管 CPU 是 否 是 关中 断 的 ,只 要 这 些 中 断 请 求 一 旦 提出 ,CPU 必须 立即 响应 。 例 如 ,电源 
掉 电 事件 所 引起 的 中 断 就 是 不 可 禁止 和 屏蔽 中 断 。 


9.3.2 中 断 的 分 类 与 优先 级 


根据 系统 对 中 断 处 理 的 需要 ,操作 系统 一 般 对 中 断 进 行 分 类 ,并 对 不 同 的 中 断 赋予 不 同 
的 处 理 优先 级 ,以便 在 不 同 的 中 断 同时 发 生 时 , 按 轻重 缓急 进行 处 理 。 
根据 中 断 源 产生 的 条 件 ,可 把 中 断 分 为 外 中 断 和 内 中 断 。 
外 中 断 指 来 自 处 理 机 和 内 存 外 部 的 中 断 , 包 括 IO 设备 发 出 的 1/O 中 断 、 外 部 信号 中 
断 ( 例 如 用 户 按 Esc 键 )` 各 种 定时 器 引起 的 时 钟 中 断 以 及 调试 程序 中 设置 的 断 点 等 引起 的 
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调试 中 断 等 。 外 中 断 在 狭义 上 一 般 被 称 为 中 断 。 

内 中 断 主要 指 在 处 理 机 和 内 存 内 部 产生 的 中 断 。 内 中 断 一 般 称 为 陷阱 (trap)。 它 包括 
程序 运算 引起 的 各 种 错误 ,如 地 址 非法 、 校 验 错 、 页 面 失效 、 存 取 访 问 控制 错 、 算 术 操作 溢出 、 
数据 格式 非法 、 除 数 为 零 .非法 指令 ,用户 程序 执行 特权 指令 、 分 时 系统 中 的 时 间 片 中 断 以 及 
从 用 户 态 到 核心 态 的 切换 等 都 是 陷阱 的 例子 。 

为 了 按 中 断 源 的 轻重 缓急 处 理 响 应 中 断 ,操作 系统 对 不 同 的 中 断 赋 予 不 同 的 优先 级 。 
例如 ,在 UNIX 系统 中 ,外 中 断 和 陷阱 的 优先 级 共 分 为 8 级。 为 了 禁止 中 断 或 屏蔽 中 断 ， 
CPU 的 处 理 机 状态 字 (PSW) 中 也 设置 有 相应 的 优先 级 。 如 果 中 断 源 的 优先 级 高 于 PSW 
的 优先 级 , 则 CPU 响应 该 中 断 源 的 中 断 请 求 ,反之 ,CPU 屏蔽 该 中 断 源 的 中 断 请 求 。 

各 中 断 源 的 优先 级 在 系统 设计 时 给 定 , 在 系统 运行 时 是 固定 的 。 而 处 理 机 的 优先 级 则 
根据 执行 情况 由 系统 程序 动态 设 定 。 

除了 在 优先 级 的 设置 方面 有 区 别 之 外 ,中 断 和 陷阱 还 有 如 下 主要 区 别 ， 

(1) 陷阱 通常 由 处 理 机 正在 执行 的 现行 指令 引起 ,而 中 断 则 是 由 与 现行 指令 无 关 的 中 


断 源 引起 的 。 

(2) 陷阱 处 理 程序 提供 的 服务 为 当前 进程 所 用 ,而 中 断 处 理 程 序 提供 的 服务 则 不 是 为 
了 当前 进程 的 。 

(3) CPU 在 执行 完 一 条 指令 之 后 、 下 一 条 指令 开始 之 前 响应 中 断 ,而 在 一 条 指令 执行 
中 也 可 以 响应 陷阱 。 尽管 被 执行 的 非法 指令 不 能 执行 结束 ,但 CPU 
仍 可 对 其 进行 处 理 。 


另外 ,在 有 的 系统 中 ,陷阱 处 理 程序 被 规定 在 各 自 的 进程 上 下 文中 执行 ,而 中 断 处 理 程 
序 则 在 系统 上 下 文中 执行 。 


9.3.3 软 中 断 


上 述 中 断 和 陷阱 都 可 以 看 作 是 硬 中 断 ,因为 这 些 中 断 和 陷阱 要 通过 硬件 产生 相应 的 中 
断 请 求 。 而 软 中 断 则 不 然 , 它 是 通信 进程 之 间 用 来 模拟 硬 中 断 的 一 种 信号 通信 方式 。 软 中 
断 与 硬 中 断 相同 的 地 方 是 : 其 中 断 源 发 中 断 请 求 或 软 中 断 信号 后 ,CPU 或 接收 进程 在 适当 
的 时 机 自动 进行 中 断 处 理 或 完成 软 中 断 信号 所 对 应 的 功能 。 这 里 用 “适当 的 时 机 ” 几 个 字 是 
表示 接收 软 中 断 信号 的 进程 不 一 定 正好 在 接收 时 占有 处 理 机 ,而 相应 的 处 理 必须 等 到 该 接 
收 进程 得 到 处 理 机 之 后 才能 进行 。 如 果 该 接收 进程 是 占据 处 理 机 的 ,那么 ,与 中 断 处 理 相 
同 ,该 接收 进程 在 接收 到 软 中 断 信 号 后 将 立即 转 去 执行 该 软 中 断 信号 所 对 应 的 功能 。 

软 中 断 的 概念 主要 来 源 于 UNIX 系统 。 在 前 面 介 绍 进程 通信 的 有 关 章 节 中 ,已 对 
UNIX 的 软 中 断 通信 进行 了 介绍 ,这 里 不 再 重复 。 

需要 说 明 的 一 点 是 ,在 有 些 系统 中 ,大 部 分 的 陷阱 是 转化 为 软 中 断 处 理 的。 由 于 陷阱 主 
ee 因此 ,如 果 当 前 执行 指令 产生 陷阱 的 话 , 则 向 当前 执行 进程 自身 发 
一 个 软 中 断 信 号 从 而 立即 进入 陷阱 处 理 程序 。 


9.3.4 中断 处 理 过程 


一 旦 CPU 响应 中 断 , 转 入 中 断 处 理 程序 ,系统 就 开始 进行 中 断 处 理 。 下 面 说 明 中 断 处 
理 过 程 : 
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(1) CPU 检查 响应 中 断 的 条 件 是 否 满足 。CPU 响应 中 断 的 条 件 是 有 来 自 中 断 源 的 中 
断 请 求 且 CPU 允许 中 断 。 如 果 中 断 响应 条 件 不 满足 , 则 中 断 处 理 无 法 进行 。 

(2) 如 果 CPU 响应 中 断 , 则 CPU 关中 断 ,使 其 进入 不 可 再 次 响应 中 断 的 状态 。 

(3) 保存 被 中 断 进 程 现场 。 为 了 在 中 断 处 理 结 束 后 能 使 进程 正确 地 返回 到 中 断 点 , 系 
统 必 须 保 存 当 前 处 理 机 状态 字 (PSW) 和 程序 计数 器 (PC) 等 的 值 。 这 些 值 一 般 保 存在 特定 
堆栈 或 硬件 寄存 器 中 。 

(4) 分 析 中 断 原因 ,调用 中 断 处 理子 程序 。 在 多 个 中 断 请 求 同 时 发 生 时 ,处 理 优 先 级 最 
高 的 中 断 源 发 出 的 中 断 请 求 。 

在 系统 中 ,为 了 方便 处 理 ,通常 都 是 针对 不 同 的 中 断 源 编制 有 不 同 的 中 断 处 理子 程序 
(陷阱 处 理子 程序 )。 这 些 子 程序 的 入 口 地 址 (或 陷阱 指令 的 入 口 地 址 ) 存 放 在 内 存 的 特定 单 
元 中 。 再 者 ,不 同 的 中 断 源 也 对 应 着 不 同 的 处 理 机 状态 字 (PSW)。 


这 些 不 同 的 PSW 被 放 在 相应 的 内 存单 元 中 。 存 放 的 PSW 与 中 断 i 
处 理子 程序 入 口 地 址 一 起 构成 中 断 向 量 。 显 然 ,根据 中 断 或 陷阱 的 
种 类 ,系统 可 由 中 断 向 量 表 迅速 地 找到 该 中 断 响应 的 优先 级 .中 断 二 
处 理子 程序 (或 陷阱 指令 ) 的 入 口 地 址 和 对 应 的 PSW。 T 
(5) 执行 中 断 处 理子 程序 。 对 陷阱 来 说 ,在 有 些 系统 中 则 是 通 [保存 袖 煌 现场 
过 陷阱 指令 向 当前 执行 进程 发 软 中 断 信号 后 调用 对 应 的 处 理子 程 1 
序 执行 。 分 析 中 断 原 因 
转 中 断 处 理子 程序 
(6) 退出 中 断 , 恢 复 被 中 断 进 程 的 现场 或 调度 新 进程 占据 处 一 
理 机 。 执行 中 断 
(7) 开 中 断 ,CPU 继续 执行 。 处 理子 程序 
中 断 处 理 过 程 如 图 9. 8 所 示 。 
有 些 系统 中 只 在 保存 和 恢复 现场 时 禁止 中 断 , 而 在 执行 中 断 处 上 恢复 现 坷 | 
理子 程序 时 屏蔽 中 断 。 人 
上 面 描述 了 中 断 处 理 过 程 的 各 个 步骤 。 下 面 从 CPU 处 理 的 角 
度 出 发 来 形式 化 地 描述 1/O 中 断 处 理 的 控制 过 程 ,以 期 读者 能 对 中 是 
断 处 理 过 程 有 更 深入 的 了 解 。 ER 


I/O interrupt processing control: 
begin 

unusable I/O interrupt flag 
save status of interrupt program 
if input Device i Ready 
then Call input Device i Control fi 
if Output Device i Ready 
then Call Output Device i Control fi 
if Data Deliver Done 
then Call Data Deliver Done Control fi 
restore CPU status 


reset I/O interrupt flag 
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Input Device i Control: … 
Output Device i Control: … 


Data Deliver Done Control: … 


9.4 缓冲 技术 


9.4.1 缓冲 的 引入 


虽然 中 断 .DMA 和 通道 控制 技术 使 得 系统 中 设备 和 设备 .设备 和 CPU 等 得 以 并 行 工 
作 , 但 是 ,正如 在 前 面 几 节 所 讲述 的 那样 ,外 围 设备 和 CPU 的 处 理 速度 不 匹配 的 问题 是 客 
观 存 在 的 。 这 限制 了 和 处 理 机 连接 的 外 设 台 数 , 且 在 中 断 方式 时 造成 数据 丢失 。 从 而 ,外 围 
设备 和 CPU 处理 速度 不 匹配 的 问题 极 大 地 制约 了 计算 机 系统 性 能 的 进一步 提高 和 限制 了 
系统 的 应 用 范围 。 

例如 , 当 计 算 进 程 阵 发 性 地 把 大 批量 数据 输出 到 打印 机 上 打印 时 ,由 于 CPU 输出 数据 
的 速度 大 大 高 于 打印 机 的 打印 速度 ,因此 ,CPU 只 好 停 下 来 等 待 。 反 之 ,在 计算 进程 进行 计 
算 时 ,打印 机 又 因 无 数据 输出 而 空闲 无 事 。 

外 围 设 备 与 处 理 机 速度 不 匹配 的 问题 可 以 采用 设置 缓冲 区 (器 ) 的 方法 解决 。 在 设置 了 
缓冲 区 之 后 ,计算 进程 可 把 数据 首先 输出 到 缓冲 区 ,然后 继续 执行 ;而 打印 机 则 可 以 从 缓冲 
区 取出 数据 慢 慢 打印 。 

再 者 ,从 减少 中 断 的 次 数 看 ,也 存在 着 引入 缓冲 区 的 必要 性 。 在 中 断 方式 时 ,如 果 在 I/ 
9 控制 器 中 增加 一 个 100 个 字符 的 缓冲 器 , 则 由 前 面 对 中 断 方式 的 描述 可 知 ,I/O 控制 器 对 
处 理 机 的 中 断 次 数 将 降低 100 倍 , 即 等 到 能 存放 100 个 字符 的 字符 缓冲 区 装 满 之 后 才 向 处 
理 机 发 一 次 中 断 。 这 将 大 大 减少 处 理 机 的 中 断 处 理 时 间 。 即 使 是 使 用 DMA 方式 或 通道 方 
式 控制 数据 传送 时 ,如 果 不 划 分 专用 的 内 存 区 或 专用 缓冲 器 来 存放 数据 的 话 ,也 会 因为 要 求 
数据 的 进程 所 拥有 的 内 存 区 不 够 或 存放 数据 的 内 存 始 址 计算 困难 等 原因 ,而 造成 某 个 进程 
长 期 占有 通道 或 DMA 控制 器 及 设备 ,从 而 产生 所 谓 瓶颈 问题 。 

因此 ,为 了 匹配 外 设 与 CPU 之 间 的 处 理 速度 ,为 了 减少 中 断 次 数 和 CPU 的 中 断 处 理 
时 间 ,同时 也 是 为 了 解决 DMA 或 通道 方式 时 的 瓶颈 问题 ,在 设备 管理 中 引入 了 用 来 暂 存 数 
据 的 缓冲 技术 。 

根据 IO 控制 方式 ,缓冲 的 实现 方法 有 两 种 ,一 种 是 采用 专用 硬件 缓冲 器 ,例如 1/O 控 
制 絮 中 的 数据 缓冲 寄存 器 ; 男 一 种 方法 是 在 内 存 中 划 出 一 个 具有 个 单元 的 专用 缓冲 区 ,以 
便 存 放 输 入 输出 的 数据 。 内 存 缓冲 区 又 称 软件 缓冲 。 


9.4.2 缓冲 的 种 类 


根据 系统 设置 的 缓冲 器 的 个 数 ,可 把 缓冲 技术 分 为 单 缓冲 、 双 缓冲 和 多 缓冲 以 及 缓冲 池 
几 种 。 
单 缓冲 是 在 设备 和 处 理 机 之 间 设 置 一 个 缓冲 器 。 设 备 和 处 理 机 交换 数据 时 , 先 把 被 交 
换 数 据 写 和 人 缓冲 器 ,然后 ,需要 数据 的 设备 或 处 理 机 从 缓冲 器 取 走 数据 。 由 于 缓冲 器 属于 临 
界 资源 , 即 不 允许 多 个 进程 同时 对 一 个 缓冲 器 操作 ,因此 ,尽管 单 缓冲 能 匹配 设备 和 处 理 机 
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的 处 理 速 度 ,但 是 ,设备 和 设备 之 间 不 能 通过 单 缓冲 达到 并 行 操作 。 

解决 两 台 外 设 、 打 印 机 和 终端 之 间 的 并 行 操作 问题 的 办 法 是 设置 双 缓 冲 。 有 了 两 个 绥 
冲 器 之 后 ,CPU 可 把 输出 到 打印 机 的 数据 放 入 其 中 一 个 缓冲 器 (区 ) ,让 打印 机 慢 慢 打印 ; 然 
后 , 它 又 可 以 从 另 一 个 为 终端 设置 的 缓冲 器 (区 ) 中 读 取 所 需要 的 输入 数据 。 

显然 , 双 缓 冲 只 是 一 种 说 明 设 备 和 设备 .CPU 和 设备 并 行 操作 的 简单 模型 ,并 不 能 用 于 
实际 系统 中 的 并 行 操 作 。 这 是 因为 计算 机 系统 中 的 外 围 设 备 较 多 ,另外 , 双 缓 冲 也 很 难 匹配 
设备 和 处 理 机 的 处 理 速度 。 因 此 ,现代 计算 机 系统 中 一 般 使 用 多 缓冲 或 缓冲 池 结 构 。 

多 缓冲 是 把 多 个 缓冲 区 连接 起 来 组 成 两 部 分 ,一 部 分 专门 用 于 输入 , 另 一 部 分 专门 用 于 
输出 的 缓冲 结构 。 缓 冲 池 则 是 把 多 个 缓冲 区 连接 起 来 统一 管理 , 既 可 用 于 输入 又 可 用 于 输 
出 的 缓冲 结构 。 

显然 ,无 论 是 多 缓冲 还 是 缓冲 池 , 由 于 缓冲 器 是 临界 资源 ,在 使 用 缓冲 区 时 都 有 一 个 申 
请 、 释 放 和 互 斥 的 问题 。 下 面 以 缓冲 池 为 例 介绍 缓冲 的 管理 。 


9.4.3 缓冲 池 的 管理 


1. 缓冲 池 的 结构 

为 了 讨论 缓冲 池 的 管理 , 先 来 看 看 缓冲 池 的 组 成 。 缓 冲 池 由 多 个 缓冲 区 组 成 。 而 一 个 
缓冲 区 由 两 部 分 组 成 : 一 部 分 是 用 来 标识 该 缓冲 器 和 用 于 管理 的 缓冲 首部 , 另 一 部 分 是 用 
于 存放 数据 的 缓冲 体 。 这 两 部 分 有 一 一 对 应 的 映射 关系 。 对 缓冲 池 的 管理 是 通过 对 每 一 个 
缓冲 器 的 缓冲 首部 进行 操作 实现 的 。 

缓冲 首部 如 图 9. 9 所 示 , 它 包括 设备 号 ,设备 上 的 数据 块 号 ( 块 设备 时 )、 互 斥 标 识 位 以 
及 缓冲 队列 连接 指针 和 缓冲 器 号 等 。 

系统 把 各 缓冲 区 按 其 使 用 状况 连 成 3 种 队列 : 

(1) 空白 缓冲 队列 em, 其 队 首 指针 为 F(em) , 队 尾 指针 为 L(em)。 

(2) 装 满 输入 数据 的 输入 缓冲 队列 in, 其 队 首 指针 为 F(in), 队 尾 指针 为 L(in)。 

(3) 装 满 输出 数据 的 输出 缓冲 队列 out, 其 队 首 指针 为 FC(out), 队 尾 指 针 为 L(out)。 

其 队列 构成 如 图 9. 10 所 示 。 


设备 号 F(em) L(em) 
上 -| 级 站 区 : | 级 二 区 2 广 一 … 一 一 
数据 块 号 | 
F(in) L(in) 
2 盖 一 | 级 中 区 1 | | 一 | 级 中 区 ml 上 一 … 一 | 
互 斥 标识 位 Foug Loub 
连接 指针 一 缓冲 区 "| —— | 
图 9.9 缓冲 首部 图 9.10 缓冲 区 队列 


除了 3 种 缓冲 队列 之 外 ,系统 (或 用 户 进程 ) 从 这 3 种 队列 中 申请 和 取出 缓冲 区 ,并 用 得 
到 的 缓冲 区 进行 存 数 、 取 数 操作 ,在 存 数 、 取 数 操作 结束 后 ,再 将 缓冲 区 放 入 相应 的 队列 。 这 
些 缓冲 区 被 称 为 工作 缓冲 区 。 在 缓冲 池 中 ,有 4 种 工作 缓冲 区 : 
(1) 用 于 收容 设备 输入 数据 的 收容 输入 缓冲 区 hin; 
(2) 用 于 提取 设备 输入 数据 的 提取 输入 缓冲 区 sin; 
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(3) 用 于 收容 CPU 输出 数据 的 收容 输出 缓冲 区 hout; 
(4) 用 于 提取 CPU 输出 数据 的 提取 输出 缓冲 区 sout。 
缓冲 池 的 工作 缓冲 区 如 图 9. 11 所 示 。 


缓冲 池 
收 大竹 入 | [| [BW [| | 太吉 到 输入 
IO 设备 CPU 
| [Lao 上-[GHE [ow ||[ 弘 W 区 : 本 25 6. 央 
图 9.11 缓冲 池 的 工作 缓冲 区 
2. 缓冲 池 管 理 


对 缓冲 池 的 管理 由 如 下 几 个 操作 组 成 : 

(1) 从 3 种 缓冲 区 队列 中 按 一 定 的 选取 规则 取出 一 个 缓冲 区 的 过 程 take_buf(type); 

(2) 把 缓冲 区 按 一 定 的 选取 规则 插入 相应 的 缓冲 区 队列 的 过 程 add _buf (type， 
number); 

(3) 供 进程 申请 缓冲 区 用 的 过 程 get_buf(type,number); 

(4) 供 进程 将 缓冲 区 放 入 相应 缓冲 区 队列 的 过 程 put_buf(type,work_buf)。 

其 中 ,参数 type 表示 缓冲 队列 类 型 ,number 为 缓冲 区 号 ,而 work_buf 则 表示 工作 缓冲 
区 类 型 。 

使 用 这 儿 个 操作 ,缓冲 池 的 工作 过 程 可 描述 如 下 : 

首先 ,输入 进程 调用 get_buf(em,number) 过 程 从 空白 缓冲 区 队列 中 取出 一 个 缓冲 号 为 
number 的 空白 缓冲 区 ,将 其 作为 收容 输入 缓冲 区 hin, 当 hin 中 装 满 了 由 输入 设备 输入 的 数 
据 之 后 ,系统 调用 过 程 put_buf(in,hin) 将 该 缓冲 区 插入 输入 缓冲 区 队列 in 中 。 

男 外 , 当 进 程 需 要 输出 数据 时 ,输出 进程 经 过 缓冲 管理 程序 调用 过 程 get_buf (em， 
number) 从 空白 缓冲 区 队列 中 取出 一 个 空白 缓冲 区 number 作为 收容 输出 缓冲 区 hout, 待 
hout 中 装 满 输出 数据 之 后 ,系统 再 调用 过 程 put_buf(out,hout) 将 该 缓冲 区 插入 输出 缓冲 
区 队列 out。 

对 缓冲 区 的 输入 数据 和 输出 数据 的 提取 也 是 由 过 程 get_buf 和 put_buf 实现 的 。get_ 
buf(out,number) 从 输出 缓冲 区 队列 中 取出 装 满 输出 数据 的 缓冲 区 number, 将 其 作为 
sout。 当 sout 中 的 数据 输出 完毕 时 ,系统 调用 过 程 put_buf(em,sout) 将 该 缓冲 区 插入 空白 
缓冲 区 队列 。 而 get_buf(in,number) 则 从 输入 缓冲 区 队列 中 取出 一 个 装 满 输入 数据 的 缓冲 
区 number 作为 输入 缓冲 区 sin, 当 CPU 从 中 提取 完 所 需 数据 之 后 ,系统 调用 过 程 put_buf 
(em,sin) 将 该 缓冲 区 释放 和 插入 空白 缓冲 区 队列 em 中 。 

显然 ,对 于 各 缓冲 区 队列 中 缓冲 区 的 排列 以 及 每 次 取出 和 插入 缓冲 区 队列 的 顺序 都 应 
有 一 定 的 规则 。 最 简单 的 方法 是 FIFO( 先 进 先 出 ) 的 排列 方法 。 采 用 FIFO 方 法 ,过 程 put_ 
buf 每 次 把 缓冲 区 插入 相应 的 缓冲 区 队列 的 队 尾 , 而 过 程 get_buf 则 取出 相应 的 缓冲 区 队列 
的 第 一 个 缓冲 区 ,从 而 get_buf 中 的 第 二 个 参数 number 可 以 省 略 。 而 且 , 采 用 FIFO 方法 
也 省 略 了 对 缓冲 区 队列 的 搜索 时 间 。 

过 程 add_buf(type,number) 和 take_buf(type, number) 分 别 用 来 把 缓冲 区 number 插 
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入 type 队列 和 从 type 队列 中 取出 缓冲 区 number。 它 们 分 别 被 过 程 get_buf 和 put_buf 调 
用 ,其 中 ,take_buf 返回 所 取 缓 冲 区 number 的 指针 ,而 add_buf 则 将 给 定 缓冲 区 number 的 
指针 链 入 队列 。 

下 面 给 出 过 程 get_buf 和 put_buf 的 描述 。 

首先 , 设 互 斥 信号 量 S(type) ,其 初 值 为 1。 设 描述 资源 数目 的 信号 量 RS(type), 其 初 
值 为 n(n 为 type 队列 长 度 ) 。 


get buf (type,number): 
begin 
P (RS (type)) 
P(S (type)) 
Pointer of buffer (number)=take buf (type,number) 
V(S (type)) 
end 
put buf (type,number): 
begin 
P(S (type)) 
add buf (type,number) 
V(S (type)) 
V (RS (type)) 


end 


9.5 设备 分 配 


前 面 已 经 介绍 了 I/O 数据 传送 控制 方式 及 与 其 紧密 相关 的 中 断 技术 与 缓冲 技术 。 不 
过 ,在 讨论 这 些 问 题 时 ,已 经 做 了 如 下 假定 : 每 一 个 准备 传送 数据 的 进程 都 已 申请 到 了 它 所 
需要 的 外 围 设备 、 控 制 器 和 通道 。 事实 上 ,由 于 设备 ,控制 器 和 通道 资源 的 有 限 性 ,不 是 每 一 
个 进程 随时 随地 都 能 得 到 这 些 资源 。 进 程 必须 首先 向 设备 管理 程序 提出 资源 申请 ,然后 ,由 
设备 分 配 程序 根据 相应 的 分 配 算法 为 进程 分 配 资源 。 如 果 申 请 进程 得 不 到 它 所 申请 的 资源 
时 ,将 被 放 入 资源 等 待 队列 中 等 待 ,直到 所 需要 的 资源 被 释放 。 

下 面 ,讨论 设备 分 配 和 管理 的 数据 结构 ,分 配 策略 原则 以 及 分 配 算法 等 。 


9.5.1 设备 分 配 用 数据 结构 


设备 的 分 配 和 管理 通过 下 列 数据 结构 进行 。 

1. 设备 控制 表 (Device Control Table,DCT) 

设备 控制 表 (DCT) 反 映 设备 的 特性 、 设 备 和 I/O 控制 器 的 连接 情况 。 包 括 设 备 标识 、 
使 用 状态 和 等 待 使 用 该 设备 的 进程 队列 等 。 系 统 中 每 个 设备 都 必须 有 一 张 DCT, 旦 在 系统 
中 生成 时 或 在 该 设备 和 系统 连接 时 创建 ,但 表 中 的 内 容 则 根据 系统 执行 情况 而 被 动态 地 修 
改 。DCT 包括 以 下 内 容 : 

(1) 设备 标识 符 , 用 来 区 别 设备 。 

(2) 设备 类 型 ,反映 设备 的 特性 ,例如 是 终端 设备 、 块 设备 或 字符 设备 等 。 
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(3) 设备 地 址 或 设备 号 ,由 计算 机 原理 课 可 知 ,每 个 设备 都 有 相应 的 地 址 或 设备 号 
个 地 址 既 可 以 是 和 内 存 统一 编 址 的 ,也 可 以 是 单独 编 址 的 。 

(4) 设备 状态 , 指 设 备 是 处 于 工作 中 还 是 空闲 中 。 

(5) 等 待 队 列 指针 ,等 待 使 用 该 设备 的 进程 组 成 等 待 队 列 ,其 队 首 和 队 尾 指针 存放 在 
DCT 中 。 

(6) I/O 控制 器 指针 ,该 指针 指向 该 设备 相连 接 的 I/O 控制 器 。 

2. 系统 设备 表 (System Device Table.SDT) 

系统 设备 表 (SDT) 整 个 系统 一 张 , 它 记录 已 被 连接 到 系统 中 的 所 有 物理 设备 的 情况 ,并 
为 每 个 物理 设备 设 一 个 表 项 。SDT 的 每 个 表 项 包括 的 内 容 如 下 : 

(1) DCT 指针 ,该 指针 指向 有 关 设 备 的 设备 控制 表 。 

(2) 正在 使 用 设备 的 进程 标识 。 

(3) 设备 类 型 和 设备 标识 符 ,该 项 的 意义 与 DCT 中 的 相同 。 

SDT 的 主要 意义 在 于 反映 系统 中 设备 资源 的 状态 , 即 系统 中 有 多 少 设备 ,有 多 少 是 空 
闲 的 ,而 又 有 多 少 已 分 配给 了 哪些 进程 。 

3. 控制 器 表 (COntroller Control Table,COCT) 

COCT 也 是 每 个 控制 器 一 张 , 它 反映 1/O 控制 器 的 使 用 状态 以 及 和 通道 的 连接 情况 等 
(在 DMA 方式 时 ,该 项 是 没有 的 ) 。 

4. 通道 控制 表 (CHannel Control Table,CHCT) 

该 表 只 在 通道 控制 方式 的 系统 中 存在 ,也 是 每 个 通道 一 张 。CHCT 包括 通道 标识 符 、 
通道 忙 / 闲 标 识 、 等 待 获 得 该 通道 的 进程 等 待 队列 的 队 首 指针 与 队 尾 指针 等 。 

SDT、DCT、COCT 及 CHCT 如 图 9. 12 所 示 。 


sDT DCT 
1 ll 
表 目 1 设备 标识 
: 获得 设备 的 进程 一 一 一 一 一 一 一 
表 目 1 设备 忙 闲 标记 
By 一 COcT 指 针 
: 设备 等 待 队 列 首 
设备 等 待 队列 尾 
COCT CHCT 
控制 器 标识 | ”通道 标识 。 | 
控制 器 忙 采 标记 通道 信 闲 标记 
CHCT 指 针 通道 等 待 队 列 首 
控制 器 等 待 队列 首 通道 等 待 队列 尾 
控制 器 等 待 队列 尾 : 
图 9.12 数据 结构 表 
显然 ,一 个 进程 只 有 获得 了 通道 、 控 制 器 和 所 需 设 备 三 者 之 后 , 才 具 备 了 进行 I/O 操作 


的 物理 条 件 。 
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9.5.2 设备 分 配 的 原则 


1. 设备 分 配 原则 

设备 分 配 的 原则 是 根据 设备 特性 、 用 户 要 求 和 系统 配置 情况 决定 的 。 设 备 分 配 的 总 原 
则 是 既 要 充分 发 挥 设备 的 使 用 效率 , 尽 可 能 地 让 设备 忙 ,但 又 要 避免 由 于 不 合理 的 分 配方 法 
造成 进程 死 锁 ;另外 还 要 做 到 把 用 户 程 序 和 具体 物理 设备 隔离 开 来 , 即 用 户 程 序 面 对 的 是 逻 
辑 设备 ,而 分 配 程序 将 在 系统 把 逻辑 设备 转换 成 物理 设备 之 后 ,再 根据 要 求 的 物理 设备 号 进 
行 分 配 , 如 图 9. 13 所 示 。 


进程 P 发 来 的 IO 请 求 


1 
鄙 索 SDT 找到 DCT 指 针 


按 分 配 策略 选取 进程 P 按 分 配 策略 分 号 控 制 器 给 进程 P 
占据 该 设备 的 进程 入 1/O 等 待 队列 
搜索 COCT 找 到 
否 CHCT 指 针 
进程 P 被 选中 ? 进程 P 
等 待 该 设备 空闲 
是 进程 P 
| 等 待 通道 
的 查访 放 备 分 本 给 才 
该 设 务 分 机 
| 分 配 通 道 给 进程 P 
启动 IO 
该 设备 分 配给 进程 P 
1 
搜索 DCT， 找 到 
COCT 指 针 
进程 P 等 待 控制 器 


图 9.13 设备 分 配 流程 图 


设备 分 配方 式 有 两 种 , 即 静 态 分 配 和 动态 分 配 。 静 态 分 配方 式 是 在 用 户 作 业 开 始 执行 
之 前 ,由 系统 一 次 分 配 该 作业 所 要 求 的 全 部 设备 .控制 器 和 通道 。 一 旦 分 配 之 后 ,这 些 设备 、 
控制 器 和 通道 就 一 直 为 该 作业 所 占用 ,直到 该 作业 被 撤销 。 静 态 分 配方 式 不 会 出 现 死 锁 , 但 
设备 的 使 用 效率 低 。 因 此 ,静态 分 配方 式 并 不 符合 设备 分 配 的 总 原则 。 
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动态 分 配 在 进程 执行 过 程 中 根据 执行 需要 进行 。 当 进程 需要 设备 时 ,通过 系统 调用 命 
令 向 系统 提出 设备 请 求 , 由 系统 按照 事先 规定 的 策略 给 进程 分 配 所 需要 的 设备 .IO 控制 器 
和 通道 ,一 旦 用 完 之 后 , 便 立 即 释 放 。 动 态 分 配方 式 有 利于 提高 设备 的 利用 率 ,但 如 果 分 配 
算法 使 用 不 当 , 则 有 可 能 造成 进程 死 锁 。 

2. 设备 分 配 策略 

与 进程 调度 相似 ,动态 设备 分 配 也 是 基于 一 定 的 分 配 策略 的 。 常 用 的 分 配 策略 有 先 请 
求 先 分 配 、 优 先 级 高 者 先 分 配 策略 等 。 

1) 先 请 求 先 分 配 

当 有 多 个 进程 对 某 一 设备 提出 I/O 请 求 时 ,或 者 是 在 同一 设备 上 进行 多 次 IO 操作 
时 ,系统 按 提 出 I/O 请 求 的 先后 顺序 ,将 进程 发 出 的 IO 请 求 命令 排 成 队列 ,其 队 首 指向 被 
请 求 设备 的 DCT。 当 该 设备 空闲 时 ,系统 从 该 设备 的 请 求 队列 的 队 首 取 下 一 个 IO 请 求 消 
息 ,将 设备 分 配给 发 出 这 个 请 求 消息 的 进程 。 

2) 优先 级 高 者 先 分 配 

优先 级 高 者 指 发 出 W/O 请 求 命令 的 进程 。 这 种 策略 和 进程 调度 的 优先 数 法 是 一 致 的 ， 
即 进程 的 优先 级 高 , 它 的 I/O 请 求 也 优先 予以 满足 。 对 于 相同 优先 级 的 进程 来 说 , 则 按 先 
请 求 先 分 配 策略 分 配 。 因 此 ,优先 级 高 者 先 分 配 策略 把 请 求 某 设 备 的 IO 请 求 命令 按 进程 
的 优先 级 组 成 队列 ,从 而 保证 在 该 设备 空闲 时 ,系统 能 从 W/O 请 求 队列 队 首 取 下 一 个 具有 
最 高 优先 级 进程 发 来 的 IO 请 求 命令 ,并 将 设备 分 配给 发 出 该 命令 的 进程 。 


9.5.3 设备 分 配 算法 


根据 设备 分 配 策略 和 原则 ,使 用 系统 提供 的 SDT、.DCT、COCT 及 CHCT 等 数据 结构 ， 
当 某 个 进程 提出 I/O 设备 请 求 之 后 ,就 可 按 图 9. 13 所 示 的 流程 进行 设备 分 配 。 


9.6 I/O 进程 控制 


9.6.1 I/O 控制 的 引入 


前 面 各 节 在 描述 了 1O 数 据 传送 控制 方式 的 基础 上 ,讨论 了 中 断 、 缓 冲 技 术 以 及 进行 
W/O 数据 传送 所 必需 的 设备 分 配 策略 与 算法 。 那 么 ,系统 在 何 时 分 配 设备 ,在 何 时 申请 组 
冲 , 由 哪个 进程 进行 中 断 响应 呢 ? 另外 ,尽管 CPU 向 设备 或 通道 发 出 了 启动 指令 ,设备 的 
启动 以 及 WO 控制 器 中 有 关 寄 存 器 的 值 由 谁 来 设置 呢 ? 这 些 都 是 前 面 几 节 的 讨论 中 没有 
解决 的 问题 。 

从 用 户 进 程 的 输入 输出 请 求 开 始 , 给 用 户 进 程 分 配 设 备 和 启动 有 关 设 备 进 行 IO 操 
作 , 以 及 在 1/O 操作 完成 之 后 响应 中 断 ,进行 善后 处 理 为 止 的 整个 系统 控制 过 程 称 为 IO 
控制 。 


9.6.2 I/O 控制 的 功能 


1/O 控制 的 功能 如 图 9. 14 所 示 。 
1/O 控制 过 程 首先 收集 和 分 析 调 用 I/O 控制 过 程 的 原因 : 是 外 设 来 的 中 断 请 求 ? 还 是 
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外 设 中 断 请 求 户 进程 IO 请 求 


| | 
中 断 原 因 分 析 LO 请求 处 理 
1 设备 分 配 程序 IO 控制 
唤醒 Es 
中 断 处 理 程序 缓冲 区 管理 
1 1 启动 IO 指令 
中 断 响应 设备 驱动 程序 或 通道 程序 


图 9.14 I/O 控制 的 功能 


进程 来 的 I/O 请 求 ? 然后 ,根据 不 同 的 请 求 ,分 别 调用 不 同 的 程序 模块 进行 处 理 

图 9. 14 中 各 子 模块 的 功能 可 简单 地 说 明 如 下 。 

I/O 请 求 处 理 是 用 户 进程 和 设备 管理 程序 接口 的 一 部 分 , 它 把 用 户 进程 的 I/O 请求 变 
换 为 设备 管理 程序 所 能 接收 的 信息 。 一 般 来 说 ,用 户 的 W/O 请 求 包 括 所 申请 进行 1/O 操作 
的 迎 辑 设备 名 、 要 求 的 操作 、 传 送 数据 的 长 度 和 起 始 地 址 等 。I/O 请 求 处理 模 块 对 用 户 的 I/ 
O 请 求 进行 处 理 。 它 首先 将 1/O 请 求 中 的 逻辑 设备 名 转换 为 对 应 的 物理 设备 名 ;然后 , 检 
查 I/O 请 求 命令 中 是 否 有 参数 错误 ;在 I/O 请 求 命令 参数 正确 时 , 它 把 该 命令 插入 指向 相 
应 DCT 的 1/O 请 求 队列 ;然后 启动 设备 分 配 程序 。 在 有 通道 的 系统 中 ,1/O 请 求 处 理 模 块 
还 将 按 I/O 请 求 命 令 的 要 求 编制 出 通道 程序 。 

在 设备 分 配 程序 为 1/O 请 求 分 配 了 相应 的 设备 .控制 器 和 通道 之 后 ,I/O 控制 模块 还 将 
启动 缓冲 区 管理 模块 为 此 次 I/O 传送 申请 必要 的 缓冲 区 ,以 保证 1/O 传送 的 顺利 完成 。 组 
冲 区 的 申请 也 可 在 设备 分 配 之 前 进行 。 例 如 UNIX 系统 首先 请 求 缓冲 区 ,然后 把 1/O 请 求 
命令 写 到 缓冲 区 中 并 将 该 缓冲 区 挂 到 设备 的 I/O 请 求 队列 上 。 

另外 ,在 数据 传送 结束 后 ,外 设 发 出 中 断 请 求 ,I/O 控制 过 程 将 调用 中 断 处 理 程序 和 做 
出 中 断 响应 。 对 于 不 同 的 中 断 , 其 善后 处 理 也 不 同 。 例 如 处 理 结 束 中 断 时 ,要 释放 相应 的 设 
备 .控制 器 和 通道 ,并 唤醒 正在 等 待 该 操作 完成 的 进程 。 另 外 ,还 要 检查 是 否 还 有 等 待 该 设 
备 的 1/0O 请 求 命令 。 如 有 , 则 要 通知 I/O 控制 过 程 进行 下 一 个 1/O 传送 。 


9.6.3 I/0O 控制 的 实现 


1/O 控制 过 程 在 系统 中 可 以 按 3 种 方式 实现 : 

(1) 作为 请 求 IO 操作 的 进程 的 一 部 分 实现 。 这 种 情况 下 ,请 求 IO 操作 的 进程 应 具有 
良好 的 实时 性 , 且 系统 应 能 根据 中 断 信 号 的 内 容 准 确 地 调度 到 请 求 相应 IO 操作 的 进程 占据 
处 理 机 ,因为 在 大 多 数 情 况 下 , 当 一 个 进程 发 出 I/O 请 求 命 令 之 后 ,都 被 阻塞 进入 睡眠 态 。 

(2) 作为 当前 进程 的 一 部 分 实现 。 这 种 情况 下 ,不 要 求 系统 具有 高 的 实时 性 。 但 由 于 
当前 进程 与 完成 的 1/O 操作 无 关 , 所 以 当前 进程 不 能 接受 I/O 请 求 命令 的 启动 /O 操作 。 
不 过 ,当前 进程 可 以 在 接收 到 中 断 信号 后 ,将 中 断 信 号 转交 给 I/O 控制 模块 处 理 , 因 此 ,如 
果 让 请 求 IO 操作 的 进程 调用 I/O 操作 控制 部 分 (1/O 请 求 处 理 \ 设 备 分 配 、 缓 冲 区 分 配 
等 ) ,而 让 当前 进程 负责 调用 中 断 处 理 部 分 ,也 是 一 种 可 行 的 I/O 控制 方案 。 
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(3) W/O 控制 由 专门 的 系统 进程 一 一 1/O 进程 完成 。 在 用 户 进 程 发 出 I/O 请 求 命令 之 
后 ,系统 调度 1/O 进程 执行 ,控制 1/O 操作 。 同 样 ,在 外 设 发 出 中 断 请 求 之 后 ,1/O 进程 也 被 
调度 执行 以 响应 中 断 。L/O 请 求 处 理 模块 .设备 分 配 模块 以 及 缓冲 区 管理 模块 .中 断 原 因 分 
析 模 块 、 中 断 处 理 程 序 模块 和 后 述 的 设备 驱动 程序 模块 等 都 是 1/O 进程 的 一 部 分 。 

1/O 进程 也 可 分 为 3 种 方式 实现 : 

(1) 每 类 (个 ) 设 备 设 一 个 专门 的 IVO 进程 , 且 该 进程 只 能 在 系统 态 下 执行 。 

(2) 整个 系统 设 一 个 IVO 进程 ,全 面 负责 系统 的 数据 传送 工作 。 由 于 现代 计算 机 系统 
设备 十 分 复杂 ,1/O 进程 的 负担 很 重 , 因 此 ,又 可 把 I/O 进程 分 为 输入 进程 和 输出 进程 。 

(3) 每 类 (个 ) 设 备 设 一 个 专门 的 VO 进程 ,但 该 进程 既 可 在 用 户 态 也 可 在 系统 态 下 
执行 。 


9.7 设备 驱动 程序 


设备 驱动 程序 是 驱动 物理 设备 和 DMA 控制 器 或 1/O 控制 器 等 直接 进行 1/O 操作 的 子 
程序 的 集合 。 它 负责 设置 相应 设备 有 关 寄 存 器 的 值 ,启动 设备 进行 1/O 操作 ,指定 操作 的 
类 型 和 数据 流向 等 。 

为 了 对 设备 驱动 程序 进行 管理 ,系统 中 设置 有 设备 开关 表 (Device Switch Table， 
DST)。 设 备 开关 表 中 给 出 相应 设备 的 各 种 操作 子 程 序 , 例 如 打开 、 关 闭 、 读 、 写 和 启动 设备 
子 程序 的 入 口 地 址 。 一 般 来 说 ,设备 开关 表 是 二 维 结构 ,其 中 的 行 和 列 分 别 表示 设备 类 型 和 
驱动 程序 类 型 。 设 备 开 关 表 也 是 1/O 进程 的 一 个 数据 结构 。1/O 控制 过 程 为 进程 分 配 设备 
和 缓冲 区 之 后 ,可 以 使 用 设备 开关 表 调 用 所 需 的 设备 驱动 程序 进行 IO 操作 。 


本 章 小 结 


设备 管理 的 主要 任务 是 控制 设备 和 CPU 之 间 进 行 IO 操作 。 由 于 现代 操作 系统 的 外 
部 设备 的 多 样 性 和 复杂 性 以 及 不 同 的 设备 需要 不 同 的 设备 处 理 程序 ,设备 管理 成 了 操作 系 
统 中 最 复杂 、 最 具有 多 样 性 的 部 分 。 设 备 管理 模块 在 控制 各 类 设备 和 CPU 进行 VO 操作 
的 同时 ,还 要 尽 可 能 地 提高 设备 和 设备 之 间 、 设 备 和 CPU 之 间 的 并 行 操作 度 以 及 设备 利用 
率 , 从 而 使 得 整个 系统 获得 最 佳 效 率 。 另 外 ,设备 管理 模块 还 应 该 为 用 户 提供 一 个 透明 的 、 
易于 扩展 的 接口 ,以 使 得 用 户 不 必 了 解 具 体 设 备 的 物理 特性 和 便于 设备 的 追加 和 更 新 。 

围绕 着 上 述 目的 ,本 章 从 设备 的 分 类 出 发 ,对 设备 和 CPU 之 间 的 数据 传送 的 控制 方 
式 .中 断 和 缓冲 技术 .设备 分 配 原则 和 算法 、.I/O 控制 过 程 以 及 设备 驱动 程序 进行 了 介绍 和 
讨论 。 

常用 的 设备 和 CPU 之 间 的 数据 传送 控制 方式 有 4 种 ,它们 是 程序 直接 控制 方式 .中 断 
控制 方式 .DMA 方式 和 通道 方式 。 程 序 直 接 控制 方式 和 中 断 控制 方式 都 只 适用 于 简单 的 、 
外 设 很 少 的 计算 机 系统 ,因为 程序 直接 控制 方式 耗费 大 量 的 CPU 时 间 ,而 且 无 法 检测 发 现 
设备 或 其 他 硬件 产生 的 错误 ,设备 和 CPU .设备 和 设备 只 能 串 行 工作 。 中 断 控制 方式 虽然 
在 某 种 程度 上 解决 了 上 述 问题 ,但 由 于 中 断 次 数 多 ,因而 CPU 仍 需要 花 较 多 的 时 间 处 理 中 
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断 , 而 且 能 够 并 行 操作 的 设备 台数 也 受到 中 断 处 理 时 间 的 限制 ,中 断 次 数 增多 导致 数据 丢 
失 。DMA 方式 和 通道 方式 较 好 地 解决 了 上 述 问题 。 这 两 种 方式 采用 了 外 设 和 内 存 直 接 交 
换 数据 的 方式 。 只 有 在 一 段 数据 传送 结束 时 ,这 两 种 方式 才 发 出 中 断 信号 要 求 CPU 做 善 
后 处 理 , 从 而 大 大 减少 了 CPU 的 工作 负担 。DMA 方式 与 通道 控制 方式 的 区 别 是 ,DMA 方 
式 要 求 CPU 执行 设备 驱动 程序 启动 设备 ,给 出 存放 数据 的 内 存 始 址 以 及 操作 方式 和 传送 
字 节 长 度 等 ;而 通道 控制 方式 则 是 在 CPU 发 出 W/O 启动 命令 之 后 ,由 通道 指令 来 完成 这 些 
工作 。 

中 断 及 其 处 理 是 设备 管理 中 的 一 个 重要 部 分 。 本 章 在 介绍 中 断 的 基本 概念 的 同时 ,对 
陷阱 和 软 中 断 也 做 了 相应 的 介绍 和 比较 。 另 外 ,还 介绍 和 描述 了 中 断 处 理 的 基本 过 程 。 

缓冲 是 为 了 匹配 设备 和 CPU 的 处 理 速度 ,以 及 为 了 进一步 减少 中 断 次 数 和 解决 DMA 
方式 或 通道 方式 时 的 瓶颈 问题 引入 的 。 缓 冲 有 硬 缓冲 和 软 缓冲 之 分 。 本 章 还 介绍 了 对 缓冲 
池 的 管理 和 操作 。 由 于 缓冲 区 是 临界 资源 ,所 以 对 缓冲 区 或 缓冲 队列 的 操作 必须 互 斥 。 

然后 ,介绍 了 设备 分 配 的 原则 和 算法 。 设 备 分 配 应 保证 设备 有 高 的 利用 率 和 避免 产生 
死 锁 。 进 程 只 有 在 得 到 了 设备 .I/O 控制 器 和 通道 (通道 控制 方式 时 ) 之 后 ,才能 进行 /O 操 
作 。 另 外 ,用 户 进程 给 出 的 1/O 请 求 中 包含 逻辑 设备 号 ,设备 管理 程序 必须 将 其 变换 成 实 
际 的 物理 设备 。1/O 请 求 命令 中 的 其 他 参数 将 被 用 来 编制 通道 指令 程序 或 由 设备 开关 表 选 
择 设备 驱动 程序 。 

1/O 控制 过 程 是 对 整个 1/O 操作 的 控制 ,包括 对 用 户 进程 I/O 请 求 命令 的 处 理 ,进行 设 
备 分 配 和 缓冲 区 分 配 ,启动 通道 指令 程序 或 驱动 程序 进行 真正 的 1/O 操作 ,以 及 分 析 中 断 
原因 和 响应 中 断 等 。 


习 题 


设备 管理 的 目标 和 功能 是 什么 ? 

数据 传送 控制 方式 有 哪 几 种 ? 试 比较 它们 各 自 的 优 缺 点 。 

什么 是 通道 ” 试 画 出 通道 控制 方式 时 的 CPU ,通道 和 设备 的 工作 流程 图 。 
什么 叫 中 断 ? 什么 叫 中 断 处 理 ? 什么 叫 中 断 响应 ? 

什么 叫 关 中 断 ” 什么 叫 开 中 断 ? 什么 叫 中 断 屏蔽 ? 

什么 是 陷阱 ?什么 是 软 中 断 ?” 试 述 中 断 、 陷 阱 和 软 中 断 之 间 的 异同 。 

描述 中 断 控制 方式 时 的 CPU 动作 过 程 。 

什么 是 缓冲 ? 为 什么 要 引入 缓冲 ? 

设 在 对 缓冲 队列 em in 和 onut 进行 管理 时 ,采用 最 近 最 少 使 用 算法 存 取 缓冲 区 , 即 在 
一 个 缓冲 区 分 配给 进程 之 后 ,只 要 不 是 所 有 其 他 的 缓冲 区 都 在 更 近 的 时 间 内 被 使 用 过 
了 , 则 该 缓冲 区 不 再 分 配 出 去 。 试 描述 过 程 take_buf(type, number) 和 add_buf(type， 


和 0 0 2 
> 


number) 。 
9. 10 试 述 对 缓冲 队列 em in 和 out 采用 最 近 最 少 使 用 算法 对 改善 IO 操作 性 能 有 什么 
好 处 。 
9.11 用 于 设备 分 配 的 数据 结构 有 哪些 ? 它们 之 间 的 关系 是 什么 ? 
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9.12 设计 一 个 设备 分 配 的 安全 检查 程序 ,以 保证 把 某 台 设 备 分 配给 某 进程 时 不 会 出 现 
死 锁 。 

9.13 什么 是 IO 控制 ? 它 的 主要 任务 是 什么 ? 

9.14 I/O 控制 可 用 哪 几 种 方式 实现 ? 各 有 什么 优 和 缺点? 

9.15 设备 驱动 程序 是 什么 ? 为 什么 要 有 设备 驱动 程序 ? 用 户 进程 怎样 使 用 设备 驱动 
程序 ? 
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第 10 章 ”Linux 文件 系统 


10.1 Linux 文件 系统 的 特点 与 文件 类 别 


10.1.1 特点 


在 第 8 章 中 介绍 了 文件 系统 的 基本 原理 。 本 章 通过 Linux 的 文件 系统 来 进一步 深入 了 


解 文件 系统 与 操作 系统 其 他 部 分 的 关系 以 及 文件 系统 的 设计 方法 。 一 个 Linux 的 初始 用 户 
最 先 接受 的 概念 可 能 是 文件 ,因为 用 户 首先 必须 把 自己 所 输入 的 数据 写 入 文件 或 启动 有 关 
系统 文件 执行 。 


在 Linux 系统 中 ,所 有 的 文件 被 组 织 到 一 个 统一 的 树 形 目录 结构 中 。 也 就 是 说 ,整个 文 
件 系统 有 一 个 “ 根 ”(/) ,然后 在 根 上 分 “ 权 ”( 目 录 ) ,任何 一 个 分 权 上 都 可 以 再 分 权 , 权 上 也 可 
以 长 出 “叶子 ”( 文 件 )。“ 根 ?和 ”* 权 ?在 Linux 中 被 称 为 “目录 ”或 “文件 夹 "。 而 “叶子 ” 则 是 
一 个 个 的 文件 。 这 样 不 论 底层 存储 设备 是 什么 ,展现 在 用 户 面前 的 均 是 一 个 统一 的 文件 系 
统 视图 。 

在 Linux 系统 中 ,典型 的 目录 结构 如 下 : 


~ 根 目录 

/bin 存放 常用 的 用 户 命令 

/boot 存放 内 核 及 系统 启动 所 需 的 文件 
/dev 存放 设备 文件 

/etc 存放 配置 文件 

/home 用 户 文件 的 主 目录 

/lib 存放 运行 库 

/media 其 他 文件 系统 的 挂 载 点 

/mnt 与 /media 目录 相同 

/proc proc 文件 系统 的 挂 载 点 ,用 于 存放 进程 和 系统 信息 
/root 超级 用 户 (root) 的 主 目录 

/sbin 存放 系统 管理 程序 

/sys 用 于 存放 与 设备 相关 的 系统 信息 
/tmp 存放 临时 文件 

/usr 存放 应 用 软件 包 的 主 目录 


/usr/X11R6 存放 X Window 程序 
/usr/bin 存放 应 用 程序 
/usr/doc 存放 应 用 程序 文档 
/usr/etc 存放 配置 文件 
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/usr/games ”存放 游戏 

/usr/include ”存放 C 语言 开发 工具 的 头 文件 

/usr/lib 存放 运行 库 

/usr/local 存放 本 地 增加 的 应 用 程序 

/usr/man 存放 用 户 帮 助 文件 

/usr/sbin 存放 系统 管理 程序 

/usr/share 存放 结构 独立 的 数据 

/usr/src 存放 程序 源 代码 

/var 存放 系统 产生 的 文件 ,如 日 志 等 

以 上 列 出 的 是 一 个 典型 的 Linux 系统 目录 结构 。 各 个 目录 节点 之 下 都 会 有 一 些 文件 和 
子 目 录 。 并 且 ,系统 在 创建 每 一 个 目录 时 ,都 会 自动 为 它 设置 两 个 目录 文件 ,一 个 是 *.”, 代 
表 该 目录 自己 , 另 一 个 是 “..”, 代 表 该 目录 的 父 目录 。 对 于 根 目 录 ,“.” 和 “..” 都 代表 其 
自己 。 

文件 系统 被 组 织 成 树 形 结构 之 后 ,文件 名 由 路 径 名 给 出 。 路 径 名 确定 一 个 文件 在 文件 
系统 中 的 位 置 。 一 个 完整 的 路 径 名 由 代表 根 目 录 的 斜 枉 开 始 , 到 所 指定 的 文件 为 止 。 例 如 
/usr/bin/man 确 定 了 文件 man 在 文件 系统 中 的 位 置 。 另 外 ,路 径 名 也 可 从 正在 执行 进程 的 
当前 目录 开始 指定 ,例如 , 若 当 前 目录 是 /home/zhang 的 话 ,路 径 名 a. txt 与 /home/zhang/ 
a. txt 具有 相同 的 效果 。 

一 般 来 说 ,除了 具有 树 形 结构 的 特点 之 外 ,Linux 文件 系统 还 具有 如 下 特点 : 
文件 是 无 结构 的 字符 流 式 文 件 。 
文件 可 以 动态 地 增长 或 减少 。 
文件 数据 可 由 文件 拥有 者 设置 相应 的 访问 权限 而 受到 保护 。 
外 部 设备 ,例如 磁盘 设备 .键盘 .鼠标 .串口 等 都 被 看 作文 件 。 从 而 ,设备 可 通过 文件 
系统 隐蔽 掉 设 备 特 性 。 在 文件 系统 中 ,设备 文件 占据 着 文件 系统 目录 结构 中 相应 的 
位 置 ,用 户 程序 使 用 相同 的 系统 调用 和 语法 来 读 、 写 设备 文件 和 普通 文件 。 因 此 ,用 
户 程序 既 没 有 必要 知道 设备 的 内 部 特性 ,也 不 必 在 更 换 或 增加 设备 之 后 修改 自己 。 

相对 于 Linux 2.4 内 核 版 本 ,Linux 2.6 内 核 版 本 对 文件 系统 做 了 一 些 改进 ,从 本 地 文 
件 系统 看 ,Linux 2. 6 内 核 支持 日 志文 件 系 统 功能 ,支持 文件 的 扩展 属性 及 POSIX 标准 访问 
控制 ;从 网 络 文件 系统 来 看 ,Linux 2. 6 内 核实 验 性 地 支持 NFSv4 版 本 在 客户 端 和 服务 器 端 
的 实现 ,使 网 络 文件 系统 管理 更 便捷 ,并 加 强 了 对 Windows 类 型 网 络 文件 系统 的 支持 。 


10.1.2 文件 类 型 


Linux 文件 可 分 为 6 种 类 型 ,它们 是 普通 文件 .目录 文件 .设备 文件 (包括 字符 设备 文件 
和 块 设 备 文 件 )、 有 名 管道 (FIFO) 、 软 链接 和 UNIX 域 套 接 字 。 其 中 最 常见 的 是 普通 文件 、 
目录 文件 和 设备 文件 3 类。 

普通 文件 即 存储 用 户 和 系统 的 有 关 数 据 和 程序 的 文件 。 它 是 无 结构 ,无 记录 概念 的 字 
符 流 式 文 件 。 

目录 文件 则 是 由 文件 系统 中 的 各 个 目录 所 形成 的 文件 。 这 种 文件 在 形式 上 同 普通 文件 
一 样 ,由 系统 将 其 解释 成 目录 。 在 Linux 系统 中 ,一 个 目录 文件 由 多 个 目录 项 组 成 ,而 每 个 

。 234 。 


目录 项 则 由 文件 名 及 指示 相应 的 文件 索引 节点 (inode) 的 标识 符 id 组 成 。 

普通 文件 和 目录 文件 都 是 无 结构 、 无 记录 概念 的 字符 流 式 文件 。 

设备 文件 与 普通 文件 和 目录 文件 不 同 , 它 除了 在 目录 文件 和 文件 索引 节点 表 中 占据 相 
应 的 位 置 之 外 ,并 不 占有 实际 的 物理 存储 块 。 因 此 ,对 设备 文件 的 读 、 写 操作 将 实际 上 变 为 
对 设备 的 操作 ,而 对 设备 文件 的 保护 也 将 变 成 对 设备 的 保护 。 例 如 : 


#cp /dev/ttyl terminalread 


把 在 第 一 个 虚拟 终端 上 输入 的 字符 (设备 文件 /dev/ttyl 是 用 户 虚 拟 终端 1) 读 入 ,并 把 它们 
复制 到 文件 terminalread 上 。 


10.2 Linux 的 虚拟 文件 系统 


10.2.1 虚拟 文件 系统 框架 


随 着 需求 的 增长 ,要 求 操作 系统 能 够 支持 多 种 不 同 的 文件 系统 。 为 实现 这 个 功能 ， 
Linux 内 核 使 用 了 虚拟 文件 系统 。(Virtual File System ,或 称 为 Virtual Filesystem Switch， 
VFS)。VFS 是 Linux 内 核 中 的 一 个 软件 层 ,用 于 给 用 户 空间 的 程序 提供 文件 系统 接口 。 
它 也 提供 了 内 核 中 的 一 个 抽象 功能 ,允许 不 同 的 文件 系统 共存 。VFS 隐藏 了 各 种 硬件 的 具 
体 细节 ,为 所 有 的 文件 系统 操作 提供 了 统一 的 接口 。 这 样 ,借助 YFS ,在 Linux 系统 中 可 以 
使 用 多 个 不 同 的 文件 系统 。 不 同 的 文件 系统 被 挂 装 以 后 ,对 它们 的 使 用 与 传统 的 单一 文件 
系统 没有 区 别 。 

VFS 是 由 面向 对 象 的 思想 发 展 起 来 的 ,VFS 提供 一 个 抽象 基 类 ,由 这 个 基 类 派生 出 的 
子 类 支持 具体 的 文件 系统 。VFS 只 代表 内 核 中 的 一 个 文件 系统 ,而 VFS 的 索引 节点 inode 
只 代表 内 核 中 的 一 个 文件 ,它们 只 存在 于 内 核 中 。 真 正 的 文件 系统 ,如 ext2、nfs 和 vfat 等 ， 
必须 在 VFS 提供 的 统一 的 接口 支持 下 才能 工作 。VFS 提供 的 公共 接口 对 于 应 用 程序 而 言 
是 透明 的 , 当 应 用 程序 进行 文件 系统 操作 时 ,内 核 的 文件 子 系统 将 首先 调用 VFS 的 相应 函 
数 ,该 函数 先 处 理 与 设备 无 关 的 操作 ,然后 根据 VFS 结构 以 及 它 的 inode 节点 提供 的 信息 ， 
调用 真正 的 文件 系统 中 对 应 的 函数 ,处 理 与 设备 相关 的 操作 。 

Linux 的 虚拟 文件 系统 为 多 种 类 型 的 文件 系统 提供 了 支持 ,包括 : 

(1) 基于 磁盘 的 文件 系统 ,如 ext2、ext3、reiserfs、JFS 和 XFS 等 ;以 及 UNIX System V 
的 文件 系统 ;微软 公司 开发 的 MS_DOS、vfat 及 ntfs;ISO 9660 光盘 文件 系统 等 。 

(2) 基于 网 络 的 文件 系统 ,如 NFS、SMB 和 OCFS 等 。 

(3) 特殊 的 文件 系统 ,如 proc 和 sysfs。 它 们 并 不 管理 真正 的 磁盘 空间 ,而 是 通过 它们 
访问 内 核 数据 。 


10.2.2 Linux 虚拟 文件 系统 的 数据 结构 


虚拟 文件 系统 (VFS) 在 文件 系统 中 引入 了 一 个 通用 文件 模型 ,这 个 通用 文件 模型 是 面 
向 对 象 的 。 由 于 Linux 没有 使 用 面向 对 象 的 程序 设计 语言 开发 ,而 是 使 用 C 语言 开发 , 因 
此 对 象 是 用 数据 结构 实现 的 。 这 个 模型 由 下 列 主 要 对 象 组 成 : 

。 超级 块 (superblock)。 存 放 已 挂 装 文件 系统 的 有 关 信 息 。 

a 


。 索引 节点 (Cinode) 。 存 放 关 于 一 个 具体 文件 的 一 般 信息 。 每 个 索引 节点 分 配 一 个 索 


引 节 点 号 ,用 来 指示 文件 系统 中 的 指定 


。 文件 (file)。 存 放 打开 文件 与 进程 之 间 进 


文件 。 


全 区 


互 的 有 关 信 息 。 


。 目录 项 (dentry)。 保 存 目录 项 与 相应 文件 进行 链接 的 信息 。 


1. VES 的 超级 块 


内 核 为 每 一 个 已 挂 装 的 文件 系统 分 配 一 个 超级 块 ,所 有 的 超级 块 对 象 组 成 一 个 链表 。 
超级 块 数据 结构 在 下 面 列 出 ,为 节省 篇 幅 , 只 列 出 主要 成 员 : 


struct super block { 

struct list head s list; 
dev 七 s_dev; 
unsigned long 
unsigned char 
unsigned char s dirt; 


unsigned long long 


struct file system type* s_type; 
struct super operations* s_op; 
struct dquot operations* dq_op; 
struct quotactl ops* s_qcop; 


struct export operations* 
unsigned long s_flags; 
unsigned long s_magic; 


struct dentry *xs root; 


struct rw semaphore s_ umount; 
struct mutex s_lock; 
nt s_count; 
struct list head s_inodes; 
struct list head s_dirty; 
struct list head s_io; 
struct hlist head s_anon; 
struct list head s files; 
struct block device *s bdev; 
char s_id[32]; 
void *s fs info; 


} 


s blocksize; 


Ss blocksize bits; 


s_maxbytes; 


s_export op; 


/* 指向 超级 块 链 表 的 指针 */ 
/< 设备 标识 符 * / 

/* 以 字 节 为 单位 的 块 大 小 * / 
/< 以 位 为 单位 的 块 大 小 x* / 
/< 修改 ( 脏 ) 标 志 * / 

/* 文 件 最 大 尺寸 */ 

/* 文件 系统 类 型 * / 

/* 超级 块 方法 x* / 

/* 磁盘 限额 方法 * / 

/* 磁盘 限额 管理 方法 * / 

/* NFS 的 输出 方法 * / 

/* 挂 装 标 志 * / 

/* 文 件 系 统 的 魔 数 * / 

/< 文件 系统 挂 装 目录 的 目录 项 结构 * / 
/xumount 使 用 的 信号 * / 

/* 锁 标志 x / 

/* 参考 计数 器 x* / 


/< 所 有 索引 节点 的 链表 * / 

/x* 所 有 已 修改 ( 脏 ) 的 索引 节点 的 链表 * / 
/< 所 有 等 待 写 回 磁盘 的 索引 节点 链表 * / 
/*< 用 于 处 理 NFS 输出 的 匿名 目录 项 链表 * / 
/* 所 有 文件 对 象 链表 x* / 


/* 指 向 块 设备 驱动 描述 符 的 指针 * / 


/* 包含 这 个 超级 块 的 块 设 备 名 * / 
/* 指向 特定 文件 系统 超级 块 信息 数据 结构 的 指针 * / 


所 有 的 超级 块 对 象 用 双向 循环 链表 的 方式 链接 在 一 起 。 链 表 的 第 一 个 和 最 后 一 个 元 素 


分 别 存放 在 super_blocks 变量 的 slist 域 的 ne 


xt 和 prev 域 中 。 数 据 结 构 struct list_head 


仅仅 包括 指向 链表 的 前 一 个 和 后 一 个 元 素 的 指针 。 
域 s_fs_info 是 一 个 指针 ,指向 具体 文件 系统 的 超级 块 信息 数据 结构 。 对 于 ext2 文件 
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系统 ,这 个 数据 结构 是 struct ext2_sb_info。 其 中 包括 了 磁盘 片 大 小 、 每 个 块 组 中 的 块 数 和 
磁盘 分 配 位 屏蔽 等 与 VFS 的 通用 文件 模型 无 关 的 数据 。 在 挂 装 磁盘 文件 系统 时 ,内 核 从 磁 
盘 的 超级 块 中 把 相应 的 数据 读 和 内存 的 超级 块 信息 数据 结构 中 ,然后 就 对 内 存 中 的 数据 进 
行 操作 ,来 提高 效率 。 

与 超级 块 关联 的 方法 就 是 超级 块 操 作 ,这 些 操作 是 由 数据 结构 struct super_operations 
描述 的 ,其 地 址 存放 在 超级 块 的 s_op 域 中 。 


struct super operations { 


}; 


struct inode* (x*xalloc inode) (struct super blockx sb); 
void (x*x destroy inode) (struct inode* ); 

void (x* read inode) (struct inode* ); 

void (x*xdirty inode) (struct inodex* ); 

int (x*xwrite inode) (struct inode*, int); 

void (x*xput inode) (struct inodex* ); 

void (x*xdrop inode) (struct inode* ); 

void (x*delete inode) (struct inode* )，; 

void (* put_super) (struct super block* ); 

void (x*xwrite super) (struct super blockx ); 

int (x* sync fs) (struct super block* sb, int wait); 

void (x*write super lockfs) (struct super block* ); 

void (* unlockfs) (struct super block* ); 

int (x* statfs) (struct super block*, struct kstatfs* ); 
int (x* remount fs) (struct super block*, int*, char*); 
void (x*xclear inode) (struct inode* ); 

void (x*umount begin) (struct super block* ); 

int (x* Show_options) (struct seq file*, struct vfsmount* ); 
ssize 七 (<* quota read) (struct super block*, int, char*, size t, loff t); 


ssize t (x* quota write) (struct super block*, int, const char* , size t,1off t); 


每 个 具体 的 文件 系统 都 应 该 提供 这 些 超 级 块 操作 的 具体 实现 。 这 些 超级 块 操作 可 以 实 
现 文件 系统 的 挂 装 、 纯 载 和 读 写 inode 节点 等 。 

2. 索引 节点 

文件 系统 处 理 文件 所 需要 的 所 有 信息 都 存放 在 索引 节点 数据 结构 中 。 下 面 列 出 struct 
inode 的 主要 成 员 : 


struct inode { 


struct hlist node i_hash; /* 指 向 散 列 链表 的 指针 * / 

struct list head i list; /指向 描述 索引 节点 当前 状态 的 链表 的 指针 x / 
struct list head i sb list; /* 指 向 超级 块 的 索引 节点 链表 的 指针 * / 
struct list head i dentry; /* 指 向 目录 项 链表 的 指针 * / 

unsigned long i ino; /索引 节点 号 */ 

atomic t i count; /* 引 用 计数 器 x* / 

umode t i mode; /* 文 件 类 型 与 访问 权限 * / 

unsigned int i nlink; /* 硬 链接 数目 * / 
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Bi 二 i uid; /< 所 有 者 标识 符 * / 

gid 七 i gid; /* 组 标识 符 x* / 

dev t i_rdev; /* 真实 设备 标识 符 * / 

loff t i size; /< 文件 的 字 节 数 */ 

struct timespec i atime; /< 上 次 访问 文件 的 时 间 * / 
struct timespec i mtime; /* 上 次 修改 文件 的 时 间 * / 
struct timespec i ctime; /上 次 修改 索引 节点 的 时 间 * / 
unsigned int i blkbits; /* 每 块 的 位 数 * / 


unsigned long 


i blksize; 


/* 每 块 的 字 节 数 * / 


unsigned long i version; /* 版 本 号 x*/ 

unsigned long i blocks; /* 文 件 的 块 数 * / 

unsigned short i bytes; /* 文 件 占用 的 最 后 一 块 的 字 节 数 x* / 
spinlock t i_ lock; /< 保护 索引 节点 的 某 些 域 的 自 旋 锁 * / 
struct mutex i mutex; /#x 互 斥 量 */ 


struct rw_ semaphore 


i alloc sem; 


/* 读 写 保护 信号 量 , 用 于 在 直接 I/0 访 x*/ 
/* 问 文件 时 避免 竞争 关系 * / 


struct inode operations *i op; /* 索引 节点 方法 x*/ 

struct file operations *i fop; /* 默认 的 文件 操作 * / 
struct super block x*i_sb; /* 指 向 超级 块 对 象 的 指针 * / 
struct file lock x*i flock; /* 指向 文件 锁链 表 的 指针 x* / 


struct address_ space 


struct address_space 


#ifdef 


CONFIG QUOTA 


struct dquot 


#endif 


unsigned long 
unsigned long 


unsigned int 


*i mapping; 


i_data; 


x*xi dquot [MAXQUOTAS]; 


i_state; 
dirtied when; 


i flags; 


/指向 地 址 空间 对 象 的 指针 * / 
/* 文 件 的 地 址 空间 对 象 * / 


/* 索引 节点 的 磁盘 限额 * / 


/* 索引 节点 状态 标志 * / 


/* 索引 节点 修改 时 间 x*/ 
/* 文 件 系统 挂 装 标志 * / 


atomic t i writecount; /* 写 进程 的 使 用 计数 器 x* / 
void x*i_security; /指向 索引 节点 安全 结构 的 指针 x / 
union { 

void x generic ip; /x 指向 文件 系统 具体 数据 的 指针 * / 
}u; 


}; 


索引 节点 的 域 i_count 是 一 个 引用 计数 器 。 系 统 对 i 节点 进行 操作 时 ,内 核 的 VFS 子 
系统 中 的 操作 把 这 个 值 加 1 或 减 1。 如 果 计数 器 值 为 0, 则 可 以 把 这 个 内 存 索引 节点 删除 或 
分 配给 其 他 文件 。 

联合 域 u 用 于 存放 属于 具体 文件 系统 的 索引 节点 信息 。 如 果 索 引 节 点 指向 的 是 一 个 
ext2 文件 ,那么 这 个 域 就 指向 一 个 ext2_inode_info 结构 。 

每 个 索引 节点 都 要 复制 磁盘 索引 节点 包含 的 一 些 数据 ,比如 文件 占用 的 磁盘 块 数 等 。 
如 果 索 引 节 点 的 istate 域 的 值 是 I DIRTY_SYNC.I_DIRTY_DATASYNC 或 1_DIRTY_ 
PAGES ,表示 该 索引 节点 是 “ 脏 ” 的 ,说 明 该 索引 节点 所 对 应 的 磁盘 索引 节点 必须 被 更 新 。 
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根据 索引 节点 的 状态 不 同 ,每 个 VFS 索引 节点 总 会 出 现在 下 列 循环 双向 链表 的 某 个 
表 中 : 

。 未 使 用 的 索引 节点 链表 。 这 个 表 中 的 索引 节点 反映 有 效 的 磁盘 索引 节点 ,并 且 当 前 

没有 被 任何 进程 使 用 。 这 些 节点 不 是 脏 的 ,而 且 i_count 域 的 值 是 0。 这 个 链表 的 
第 一 个 和 最 后 一 个 元 素 的 指针 分 别 保存 在 inode_unused 变量 的 next 和 prev 域 中 。 
这 个 链表 用 作 磁 盘 高 速 缓存 。 

。 ed idl ni 这 些 索引 节点 反映 有 效 的 磁盘 索引 节点 ,并 且 当 前 正在 

被 某 些 进程 使 用 。 这 些 索引 节点 不 是 “ 脏 ? 的 ,而 且 i_count 域 的 值 为 正 数 。 链 表 的 
第 一 个 和 最 后 一 个 元 素 保存 在 inode_in_use 变量 中 。 

。 脏 索引 节点 链表 。 由 相应 超级 块 对 象 的 s_dirty 域 指 向 链表 中 的 首尾 元 素 。 

这 些 链 表 都 通过 适当 的 索引 节点 列表 的 i_list 域 链接 在 一 起 。 

此 外 ,每 个 挂 载 的 文件 系统 还 有 一 个 双向 循环 链表 。 每 个 索引 节点 都 被 包含 在 对 应 
件 系 统 的 链表 中 。 文 件 系统 超级 块 对 象 的 s_inodes 域 指向 该 链表 的 首 0 
象 的 i_sb_list 域 保 存 指向 链表 中 相 邻 元 素 的 指针 。 

最 后 ,索引 节点 对 象 还 被 保存 在 名 为 inode_hashtable 的 散 列表 中 。 散 列表 可 以 加 速 内 
核对 索引 节点 对 象 的 搜索 ,条 件 是 内 核 知道 索引 节点 号 和 相应 文件 所 在 的 文件 系统 的 超级 
块 的 地 址 。 由 于 散 列 技术 可 能 引起 冲突 ,所 以 索引 节点 对 象 设置 一 个 i_hash 域 , 指 向 散 列 
到 同一 地 址 的 其 他 索引 节点 。 

与 索引 节点 相 联系 的 方法 叫 索 引 节点 操作 ,由 inode_operations 结构 来 描述 ,该 结构 的 
地 址 保存 在 i_op 域 中 。 该 结构 也 包括 一 个 指向 文件 操作 方法 的 指针 。 


struct inode operations { 
int (x*xcreate) (struct inode* ,struct dentry* ,int, struct nameidata* ) 7 
struct dentry* (x* lookup) (struct inode* ,struct dentry*, struct nameidata* ); 
int (x*1link) (struct dentry* ,struct inode* ,struct dentry* ); 
int (x*xunlink) (struct inode*x ,struct dentry* ); 
int (x* symlink) (struct inode* ,struct dentry* ,const charx* ) 7 
int (x*xmkdir) (struct inode* ,struct dentry* ,int); 
int (x* rmdir) (struct inode* ,struct dentry* ); 
int (x*xmknod) (struct inode* ,struct dentry* ,int,dev t); 
int (x* rename) (struct inode* , struct dentry*, struct inode*, struct dentry* ); 
int (x* readlink) (struct dentry*x, char user* ,int); 
voidx* (x* follow link) (struct dentry*, struct nameidata* ) 7 
void (x*xput link) (struct dentry*, struct nameidata* , voidx* ); 
void (x*truncate) (struct inodex* ); 
int (x*xpermission) (struct inode*, int, struct nameidata* );，; 
int (x* setattr) (struct dentry*, struct iattr* ); 
int (x*xgetattr) (struct vfsmount * mnt, struct dentry*, struct kstat* ); 
int (x* setxattr) (struct dentry*, const char* ,const voidx ,size t,int); 
ssize t (x*xgetxattr) (struct dentry*, const char* , void*x , size t+); 
ssize t (*1listxattr) (struct dentry*, char* , Size t); 
int (x removexattr) (struct dentry*, const charx* ); 
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void (x*xtruncate range) (struct inode* , loff t, loff 七 ) 7 
J 
这 些 方法 对 所 有 的 索引 节点 和 文件 系统 类 型 都 是 可 用 的 。 
3. 文件 
文件 对 象 描述 的 是 进程 和 一 个 打开 文件 交互 的 过 程 。 文 件 对 象 是 在 文件 被 打开 的 时 候 
创建 的 ,由 一 个 file 结构 组 成 。file 对 象 的 主要 成 员 如 下 。 


struct file { 


struct list head FE /* 指向 文件 对 象 链表 的 指针 x* / 

struct dentry x*f dentry; /文件 对 应 的 目录 项 对 象 的 指针 x*/ 
struct vfsmount x*xf vfsmnt; /* 包含 这 个 文件 的 已 挂 装 的 文件 系统 * / 
struct file operations *xf_op; /x* 指向 文件 操作 表 的 指针 * / 

atomic t £f_count; /x* 引用 计数 器 x* / 

unsigned int f flags; /* 打开 文件 时 指定 的 标志 * / 

mode t fE mode; /* 进程 的 访问 模式 * / 

loff t f_pos; /* 当前 位 移 量 (文件 指针 ) * / 

struct fown struct f_owner; /* 通过 信号 进行 I/0 事 件 通 知 的 数据 x* / 
unsigned int £ uidy £ gid; /* 用 户 的 UID 和 GIDx/ 


} 


注意 ,文件 对 象 在 磁盘 上 没有 相应 的 映像 ,因此 file 结构 中 没有 “ 脏 ” 域 来 表示 文件 对 象 
是 否 被 修改 。 

存放 在 文件 对 象 中 的 主要 信息 是 文件 指针 , 即 文件 的 当前 位 置 , 对 文件 的 下 一 次 操作 从 
这 里 开始 进行 。 由 于 几 个 进程 可 能 并 发 访问 同一 个 文件 ,因此 文件 指针 不 能 存放 在 索引 节 
点 对 象 中 。 

文件 对 象 存 放 在 名 为 filp 的 slab 分 配器 高 速 缓存 中 ,缓存 的 描述 地 址 保存 在 filp_ 
cachep 变量 中 。 系 统 能 分 配 的 文件 对 象 的 总 数 是 有 限 的 ,files_stat 变量 的 max_files 域 指 
明了 能 够 分 配 的 文件 对 象 总 数 的 最 大 值 , 也 就 是 操作 系统 能 同时 打开 的 文件 总 数 的 最 大 值 。 

每 个 文件 对 象 总 包含 在 下 列 的 一 个 双向 循环 链表 中 : 
未 使 用 的 文件 对 象 链 表 。 链 表 的 首 元 素 存放 在 free_list 变量 中 。 
正在 使 用 ,但 是 没有 分 配给 超级 块 的 文件 对 象 链表 。 链 表 的 首 元 素 存放 在 anon_list 
变量 中 。 
正在 使 用 ,而 且 分 配给 超级 块 的 文件 对 象 链表 。 每 个 超级 块 对 象 把 文件 对 象 链表 的 
首 元 素 保 存在 它 的 s_files 域 中 ,这 样 属于 不 同文 件 系 统 的 文件 对 象 就 包含 在 不 同 的 
链表 中 。 

很 明显 ,由 文件 对 象 构成 的 链表 就 是 Linux 操作 系统 的 系统 打开 文件 表 。 

文件 对 象 的 f_count 域 是 一 个 参考 计数 器 ,记录 正在 使 用 这 个 文件 对 象 的 进程 数 。 在 
父 . 子 进程 共享 同一 文件 时 ,它们 使 用 同一 个 文件 对 象 。 

当 一 个 进程 需要 打开 一 个 文件 时 ,VFS 调用 get_empty_filp() 函 数 ,分 配 一 个 新 的 文件 
对 象 。 该 函数 检测 “未 使 用 ”链表 的 元 素 个 数 是 否 多 于 NR_RESERVED_FILES, 如 果 是 , 那 
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么 新 打开 的 文件 可 以 使 用 其 中 的 一 个 元 素 ; 和 否则 ,系统 分 配 新 的 内 存 。 

成 员 f_op 指向 一 个 文件 操作 表 。 每 个 文件 系统 都 有 自己 的 文件 操作 集合 ,执行 诸如 读 
写 文件 这 样 的 操作 。 当 内 核 将 一 个 索引 节点 从 磁盘 装 入 内 存 时 ,就 会 把 指向 这 些 文件 操作 
的 指针 存放 在 file_operations 结构 中 ,而 该 结构 的 地 址 存放 在 索引 节点 对 象 的 i_fop 域 。 当 
进程 打开 这 个 文件 时 ,VFS 用 这 个 地 址 初始 化 新 文件 对 象 的 f_op 域 ,使 对 文件 操作 的 后 续 
调用 能 使 用 这 些 函 数 。 

4. 目录 项 

在 Linux 系统 中 , 目录 也 是 一 类 文件 。 当 目录 被 读 入 内存,VFS 就 把 它 转换 为 基于 
dentry 结构 的 一 个 目录 项 对 象 。 超 级 块 super_block 数据 结构 的 s_root 域 记 录 了 文件 系统 
挂 装 目 录 的 基本 信息 。 进 程 查找 路 径 名 时 ,对 路 径 名 中 包含 的 每 个 目录 ,VEFS 都 为 其 创建 
一 个 目录 项 对 象 。 目 录 项 对 象 将 每 个 目录 与 其 对 应 的 索引 节点 相 联系 。 


struct dentry { 


atomic t d_count; /* 目录 项 对 象 引用 计数 器 * / 
unsigned int d flags; /* 目 录 项 标志 */ 

spinlock t d_ lock; /* 用 于 保护 dentry 对 象 的 自 旋 锁 * / 
struct inode *d inode; /* 与 文件 名 关联 的 索引 节点 * / 
struct dentry *d parent; /x* 父 目录 的 目录 项 对 象 * / 

struct qstr d name; /< 文件 名 * / 

struct list head d lru; /* 用 于 未 使 用 链表 的 指针 * / 

struect list head d child; /* 用 于 父 目 录 的 目录 项 对 象 的 链表 的 指针 * / 
struct list head d subdirs; /x* 所 有 子 目 录 的 目录 项 链表 * / 
struct dentry operations d op; /* 目 录 项 方法 */ 

struct super block*d sb; /* 文 件 的 超级 块 对 象 * / 

void xd fsdata; /< 依赖 于 文件 系统 的 数据 * / 

Struct hlist node d hash; /* 用 于 散 列表 表 项 的 指针 x / 


int d_mounted; /* 挂 装 在 这 个 目录 项 对 象 上 的 文件 系统 数目 * / 


] 


注意 ,目录 项 对 象 在 磁盘 上 没有 对 应 的 映像 ,所 以 在 dentry 结构 中 不 包含 “ 脏 ” 域 。 

由 于 从 磁盘 读 入 一 个 目录 文件 并 构造 相应 的 目录 项 对 象 要 耗费 大 量 的 时 间 , 所 以 ,为 了 
提高 处 理 目录 项 对 象 的 效率 ,Linux 使 用 目录 项 高 速 缓存 (dentry cache)。 对 于 所 有 仍然 保 
存在 目录 项 高 速 缓存 中 的 目录 项 对 象 , 与 它 相关 的 索引 节点 也 会 保存 在 内 存 的 索引 节点 高 
速 缓存 (inode cache) 中 , 而 不 会 被 释放 。 


10.2.3 VFS 的 系统 调用 


VFS 是 应 用 程序 和 具体 文件 系统 之 间 的 一 层 , 它 实现 了 与 文件 系统 相关 的 所 有 系统 调 
用 ,为 各 种 文件 系统 提供 一 个 通用 的 接口 。 应 用 程序 不 需要 关心 文件 系统 的 实现 细节 ,只 需 
要 与 VFS 进行 交互 。 
例如 ,如 果 要 实现 如 下 一 条 Shell 命令 : 
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$cp /mnt/floppy/TEST /tmp/test 


其 中 ,/mnt/floppy/ 是 软盘 上 的 MS-DOS 文件 系统 的 挂 装 目录 ,而 /tmp 是 在 ext2 文件 系统 
上 的 一 个 目录 。 然 而 cp 程序 不 需要 了 解 这 些 , 它 只 需要 使 用 标准 的 系统 调用 来 实现 。 


inf=open("/mnt/floppy/TEST", O RDONLY, 0); 
outf=open("/tmp/test", O_WRONLY |O_CREATE|O_ TRUNC, 0600); 
do 

l=read(inf, buf, 4096); 

write(outf, buf, 1); 
} while (1); 
close (outf); 


close (inf); 


VFS 处 理 的 一 些 系统 调用 如 下 : 


mount(), umount() 挂 装 / 缀 载 文 件 系 统 
sysfs() 获取 文件 系统 信息 
statfs(), fstatfs(), ustat() 获取 文件 系统 统计 信息 
chroot() 更 改 根 目录 

chdir(), fchdir(), getcwd() 操纵 当前 目录 
mkdir(), rmdir() 创建 /删除 目录 

stat(), fstat(), lstat(), access() 读 取 文件 状态 

open(), close(), creat(), umask() 打开 /关闭 文件 

dup(), dup2(), fcntl() 对 文件 描述 符 进 行 操 作 
select(), poll() 异步 1/O 通告 

read(), write(), readv(), writev(), sendfile() 进行 文件 IZO 操作 
readlink(), symlink() 对 软 链接 进行 操作 
chown(), fchown(), lchown() 更 改 文件 所 有 者 
chmod(), fchmod(), utime() 更 改 文件 属性 

pipe() 进行 通信 操作 


对 这 些 系 统 调用 的 具体 说 明 ,请 参考 Linux 的 用 户 手册 。 


10.3 文件 系统 的 注册 和 挂 装 


内 核 通过 VFS 使 用 一 个 具体 的 文件 系统 之 前 ,必须 首先 对 这 个 文件 系统 进行 注册 和 挂 
装 。 只 有 完成 对 某 个 文件 系统 的 注册 ,内 核 才 能 使 用 这 个 具体 文件 系统 的 各 种 操作 函数 ,将 
这 个 文件 系统 挂 装 的 系统 的 目录 树 上 。 


10.3.1 文件 系统 注册 


所 谓 注 册 ,就 是 把 某 个 具体 文件 系统 的 操作 代码 装 入 内 核 。 对 具体 文件 系统 的 操作 代 
码 或 者 被 包含 在 内 核 映像 中 ,或 者 作为 一 个 模块 ,被 动态 装载 。 为 了 把 对 VFS 超级 块 和 索 
引 节 点 的 操作 定向 到 对 应 的 文件 系统 上 ,也 就 是 实现 从 虚拟 文件 系统 到 实际 文件 系统 的 转 
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换 , 内 核 必 须 正确 地 对 系统 中 所 有 文件 系统 进行 跟踪 和 配置 。 

在 用 户 空间 中 ,可 以 从 /proc/filesystems 文件 读 到 所 有 已 经 在 内 核 中 注册 的 文件 系统 。 
在 内 核 中 ,每 个 已 经 注册 的 文件 系统 用 一 个 file_system_type 数据 结构 描述 。 这 个 数据 结 
构 的 主要 成 员 如 下 : 


struct file system type { 


const char * name; /* 文 件 系 统 名 x* / 

int ES flags? /* 文 件 系 统 类 型 标志 * / 

struct super block* (x get sb) (struct file system type*, int, const 
Charx , voidx* ) 7 /* 读 超级 块 的 方法 * / 

void (< kill sb) (struct super blockx ) /* 删除 超级 块 的 方法 x* / 

struct module * owner; /* 实现 文件 系统 的 模块 * / 
struct file system type* next; /x* 指 向 下 一 个 链表 元 素 的 指针 * / 
struct list head fs_supers; /* 超 级 块 对 象 链表 的 头 * / 


}; 


所 有 已 经 注册 的 文件 系统 类 型 都 装 入 一 个 简单 链表 中 ,变量 file_systems 指向 链表 的 
第 一 个 元 素 ,而 每 个 元 素 的 next 域 指 向 链表 的 下 一 个 元 素 。 内 核 通过 文件 系统 类 型 链表 来 
搜索 每 个 文件 系统 的 接口 函数 ,以 便装 入 该 文件 的 超级 块 ,实现 虚实 文件 系统 的 转换 。 

数据 结构 的 成 员 get_sb 指向 与 文件 系统 相关 的 孔 数 ,这 个 函数 从 磁盘 设备 读 取 超级 
块 ,并 写 入 对 应 的 VFS 超级 块 对 象 。 而 kill_sb 域 指向 的 函数 执行 删除 超级 块 的 工作 。 

Linux 内 核 在 编译 时 就 已 确定 所 支持 的 文件 系统 类 型 。 这 些 文件 系统 在 系统 引导 并 初 
始 化 时 ,由 内 核 调 用 函数 register_filesystem( ) 进 行 注册 ,这 个 函数 把 相应 的 file_system_ 
type 对 象 插入 文件 系统 类 型 链表 中 。 

如 果 文 件 系 统 是 一 个 内 核 可 装载 的 模块 ,那么 在 模块 被 装 人 时 ,也 要 调用 register_ 
filesystem() 函数 向 文件 系统 类 型 注册 链表 进行 注册 。 要 注册 的 文件 系统 可 能 是 MS-DOS 
文件 系统 ,或 者 是 ISO 9660 文件 系统 ,等 等 。 

一 种 新 的 文件 系统 可 以 被 注册 ,当然 也 可 以 被 注销 。 在 相应 的 模块 被 卸载 时 ,调用 
unregister_filesystem() 函 数 , 即 从 注册 链表 中 删除 该 文件 系统 的 数据 结构 。 一 旦 被 删除 ， 
系统 将 不 再 支持 该 种 文件 系统 。 


10.3.2 已 挂 装 文件 系统 描述 符 链表 


每 个 文件 系统 都 有 自己 的 挂 装 根 目录 。 如 果 某 个 文件 系统 的 根 目 录 是 系统 文件 树 的 根 
目录 ,那么 该 文件 系统 被 称 为 根 文件 系统 。 而 其 他 文件 系统 可 以 挂 装 到 系统 的 目录 树 上 ,把 
这 些 文件 系统 要 插入 的 目录 称 为 挂 装点 (mount point) 。 新 挂 装 的 文件 系统 就 是 挂 装点 目 
录 所 在 的 文件 系统 的 孩子 。 例 如 ,对 /文件 系统 和 /proc 虚拟 文件 系统 来 说 ,/ 文 件 系统 是 父 
文件 系统 ,/proc 文件 系统 是 子 文件 系统 。 

对 于 每 个 操作 系统 ,内核 必须 保存 已 经 挂 装 文件 系统 的 信息 ,包括 挂 装点 和 挂 装 标志 ， 
以 及 与 其 他 已 挂 装 文件 系统 之 间 的 关系 。 这 样 的 信息 称 为 已 挂 装 文件 系统 描述 符 , 每 个 描 
述 符 是 一 个 vfsmount 类 型 的 数据 结构 。 


struct vfsmount 
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struct list head mnt hash; 


struct vfsmount * mnt parent; 


struct dentry* mnt mountpoint; 


struct dentry*mnt root; 
struct super blockx mnt_ sb; 
struct list head mnt mounts; 
struct list head mnt chilg; 
atomic t mnt count; 

int mnt flags; 

char* mnt devname; 


struct list head mnt list; 


}; 


/x* 用 于 散 列 链表 的 指针 * / 

/* 父 文件 系统 描述 符 。 本 文件 系统 挂 装 在 其 上 * / 
/* 指 向 这 个 文件 系统 挂 装点 的 目录 项 * / 

/ 关 指 向 这 个 文件 系统 根 目录 的 目录 项 * / 

/* 指 向 这 个 文件 系统 的 超级 块 * / 

/* 挂 装 在 这 个 文件 系统 上 的 子 文件 系统 的 链表 的 头 * / 
/* 父 文件 系统 的 mnt_mount 链表 所 使 用 的 指针 x* / 
/x 引用 计数 器 x* / 

/x* 标 志 x*/ 

/* 设备 文 件 名 ,如 /dev/hdalx*/ 

/* 指 向 描述 符 全 局 链表 的 指针 * / 


在 内 核 中 ,vfsmount 数据 结构 保存 在 几 个 双向 循环 链接 表 中 : 
。 包含 所 有 已 安装 文件 系统 描述 符 的 双向 循环 全 局 链表 ,也 被 称 为 已 挂 装 文件 系统 链 
表 。 这 个 链表 的 头 保存 在 vfsmntlist 变量 中 。 描 述 符 的 mt_list 字段 包含 链表 中 指 


向 相 邻 元 素 的 指针 。 


vfsmount 描述 符 保存 在 一 个 散 列 表 中 ,这 个 散 列表 由 父 文件 系统 的 vfsmount 描述 


符 的 地 址 和 安装 点 目录 的 目录 项 对 象 的 地 址 索引 。 散 列表 存放 在 mount_hashtable 
数组 中 ,其 大 小 依赖 于 系统 中 RAM 的 容量 。 描 述 符 的 mnt_hash 用 于 这 个 散 列表 。 


对 于 每 一 个 安装 的 文件 系统 ,所 有 安装 在 它 之 上 的 子 文件 系统 形成 了 一 个 双向 循环 


链表 。 每 个 链表 的 头 存 放 在 安装 的 文件 系统 描述 符 的 mnt_mounts 字段 。 子 文件 
系统 描述 符 的 mnt_child 字段 存放 指向 链表 中 相 邻 元 素 的 指针 。 


10.3.3 挂 装 根 文件 系统 


挂 装 根 文件 系统 是 Linux 操作 系统 初始 化 的 一 个 关键 部 分 。 
当 系 统 启动 时 ,内 核 就 要 从 变量 ROOT_DEV 中 查找 包含 根 文件 系统 的 磁盘 主 设备 号 。 
这 个 变量 或 者 在 编译 内 核 时 指定 ,或 者 由 引导 程序 向 内 核 传递 一 个 root 参数 。 


挂 装 根 文 件 系统 分 为 两 个 阶段 : 


(1) 内 核 安 装 特殊 的 rootfs 文件 系统 ,该 文件 系统 仅 提 供 一 个 作为 初始 安装 点 的 空 


目录 。 


(2) 内 核 在 空 目 录 上 安装 一 个 真正 的 根 目录 。 

为 什么 内 核 要 在 安装 实际 根 目录 之 前 安装 rootfs 文件 系统 呢 ? 我 们 知道 ,rootfs 文件 
系统 允许 内 核能 够 较 容 易 地 改变 实际 根 文件 系统 。 事 实 上 ,在 某 些 情况 下 ,内 核 需要 一 个 接 
一 个 地 安装 和 名 载 几 个 根 文件 系统 。 例 如 ,一 个 发 布 版 的 初始 启动 软盘 可 能 把 具有 一 组 最 
小 驱动 程序 的 内 核 装 入 RAM 中 ,内 核 把 存放 在 RAM 磁盘 中 的 一 个 最 小 的 文件 系统 作为 
根 安装 。 接 下 来 ,在 这 个 初始 根 文件 系统 中 的 程序 探测 系统 的 硬件 , 装 入 所 有 必需 的 内 核 模 


块 ,并 从 物理 块 设备 重新 安装 文件 系统 。 


第 一 阶段 由 init_mount_tree() 完 成 的 ,该 函数 在 系统 初始 化 过 程 中 执行 。 它 首先 初始 
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化 一 个 file_system_type 数据 结构 ,文件 系统 名 name 字段 设 为 rootfs。 然 后 传递 给 register 
_filesystem() 函 数 ,进行 文件 系统 类 型 注册 。 然 后 调用 do_kern_mount() 函 数 挂 装 这 个 特 
殊 的 文件 系统 ,并 返回 新 安装 文件 系统 对 象 的 地 址 ;这 个 地 址 保存 在 root_vfsmnt 变量 

从 现在 开始 ,root_vfsmnt 表示 所 安装 文件 系统 树 的 根 。 

根 文件 系统 安装 操作 的 第 二 阶段 是 由 mount_root() 函数 在 系统 初始 化 即将 结束 时 进 
行 的 。 为 了 简单 起 见 , 只 考虑 基于 磁盘 文件 系统 的 情况 ,在 这 种 情况 下 ,该 函数 执行 下 列 主 
要 操作 

(1) 检查 ROOT_DEYV 根 设备 是 否 存 在 ,是否 正常 工作 。 

(2) 扫描 文件 系统 类 型 链表 ,对 链表 上 的 每 个 文件 系统 类 型 对 象 都 调用 相应 的 read_ 
super() ,试图 从 ROOT_DEYV 磁盘 设备 读 取 超 级 块 。 由 于 每 个 文件 系统 的 方法 都 有 一 个 唯 
一 的 魔 数 ,因此 除了 根 文 件 系 统 对 read_super() 的 调用 会 成 功 之 外 ,其 他 文件 系统 的 调用 都 
将 失败 。 同 时 read_super() 函 数 还 为 根 目录 创建 一 个 索引 节点 对 象 和 一 个 目录 项 对 象 。 

(3) 调用 add_vfsmnt, 把 第 一 个 描述 根 文件 系统 的 vfsmount 结构 插入 到 已 挂 装 文件 系 
统 链表 。 

(4) 把 current(init 进程 ) 的 根 目 录 和 当前 目录 设 为 文件 系统 根 目录 。 


10.3.4 挂 装 一 般 文件 系统 


完成 了 根 文件 系统 的 挂 装 后 ,就 可 以 开始 挂 装 其 他 文件 系统 。 其 中 的 每 个 文件 系统 都 
必须 有 自己 的 挂 装 点 (mount point) ,这 是 系统 目录 树 上 现 有 的 一 个 目录 。 

超级 用 户 可 以 使 用 mount 和 umount 命令 来 显 式 地 安装 和 种 载 一 个 文件 系统 。 一 个 典 
型 的 挂 装 命令 是 


$mount -t ext2 /dev/hda5 /mnt/hda5 


其 中 ,ext2 指出 了 要 挂 装 的 文件 系统 类 型 ,/dev/hda5 是 文件 系统 所 在 的 磁盘 分 区 ,/mnt/ 
hda5 是 文件 系统 的 挂 装点 。 

当 对 一 个 文件 系统 进行 mount 操作 时 ,VFS 需要 进行 一 系列 操作 来 完成 文件 系统 的 
挂 装 。 

(1) 搜索 文件 系统 类 型 注册 链表 file_systems, 从 中 查找 含有 该 类 型 名 (ext2) 的 节点 。 
这 个 节点 是 struct file_system_type 结构 ,其 中 的 成 员 get_sb 指向 的 函数 用 于 读 出 要 安装 
的 文件 系统 所 在 的 磁盘 超级 块 。 

(2) 内 核 必 须 准备 安装 点 的 inode 索引 节点 。 它 搜索 inode cache 中 的 hash 链表 ,并 判 
断 是 否 可 以 安装 。 只 有 是 目录 类 型 才 是 合格 的 安装 点 。 

(3) 向 super_blocks 链表 申请 一 个 空闲 的 元 素 。 

(4) 在 完成 了 上 述 的 必要 准备 工作 之 后 ,内 核 调用 get_sb 所 指向 的 函数 , 读 取 要 安装 
的 文件 系统 的 磁盘 超级 块 ,并 把 内 容 写 入 内 存 的 super_block 中 。 

(5) 检查 无 误 后 ,内 核 调用 add_vfsmnt() 函数 ,申请 一 个 struct vfsmount 数据 结构 ,十 
充 其 相 应 数据 成 员 的 值 后 ,插入 到 已 挂 装 文件 系统 描述 符 链表 vfsmntlist 的 链 尾 。 

VFS 提供 mount() 系 统 调用 ,其 对 应 的 内 核 响应 函数 是 sys_mount() ,该 函数 又 调用 
do_mount() 完 成 实际 的 挂 装 工作 。 
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10.3.5 外 载 文 件 系 统 


使 用 umount 命令 可 以 务 载 已 安装 的 文件 系统 。 务 载 前 要 对 该 文件 系统 进行 一 系列 检 
查 。 首 先 检查 该 文件 系统 中 的 文件 或 目录 是 否 还 在 使 用 ,并 检查 其 super_block. s_dirty 成 
员 是 否 置 位 , 即 检 查 该 文件 系统 是 否 被 修改 过 ,如 果 已 修改 , 则 应 先 将 修改 过 的 内 容 写 回 到 
原 物 理 设 备 中 。 当 一 切 检 查 无 误 后 ,内核 才 印 载 该 文件 系统 ,将 对 应 的 VFS 的 super_block 
超级 块 释放 ,并 将 代表 它 的 vfsmount 结构 从 文件 系统 链表 vfsmntlist 中 删除 。 

VFS 的 umount() 系 统 调 用 的 内 核 响 应 函数 是 sys_umount() ,该 函数 先 调用 umount_ 
dev() 执 行 , 后 者 又 通过 调用 do_umount() 函 数 完 成 实际 的 伸 载 工作 。 


10.4 进程 与 文件 系统 的 联系 


10.4.1 系统 打开 文件 表 


在 访问 文件 之 前 ,进程 必须 首先 打开 文件 ,系统 调用 open() 返 回 给 用 户 一 个 文件 描述 
符 , 它 是 一 个 小 整数 ,充当 打开 文件 的 句柄 。 进 程 通过 该 文件 描述 符 才 能 与 相对 应 的 文件 或 
物理 设备 相关 联 。 进 程 必须 用 该 描述 符 作为 参数 才能 调用 read 和 write 等 系统 调用 ,因为 
在 文件 描述 符 中 含有 指向 一 个 系统 打开 文件 对 象 (struct file) 的 指针 和 其 他 一 些 参数 。 在 
系统 打开 文件 对 象 中 含有 读 写 文件 的 当前 位 置 的 偏 移 量 以 及 指向 文件 索引 节点 的 指针 等 。 
因此 由 struct file 结构 组 成 的 链表 叫做 系统 打开 文件 表 。 

关于 struct file 数据 结构 和 相应 的 链表 ,已 经 在 10. 2. 2 节 中 做 过 介绍 ,这 里 就 不 再 重 
复 了 。 


10.4.2 用 户 打 开 文 件 表 


文件 只 有 通过 进程 才能 得 到 执行 和 被 访问 操作 。 而 对 每 个 进程 来 说 ,需要 记录 这 个 进 
程 当 前 打开 的 所 有 文件 的 信息 。 在 进程 描述 符 中 ,files 域 是 进程 打开 文件 表 , 用 来 记录 和 
控制 进程 当前 打开 的 文件 。 这 是 一 个 file_struct 结构 , 它 的 主要 成 员 包 括 : 


struct files struct { 


atomic t count; /* 共享 该 表 的 进程 数目 * / 

spinlock t file lock; /* 用 于 表 中 字段 的 读 / 写 自 旋 锁 * / 

int max fds; /* 文件 对 象 的 当前 最 大 数目 x* / 

int max fdset; /* 文件 描述 符 的 当前 最 大 数目 x* / 

int next _ fq; /已 经 分 配 的 最 大 文件 描述 符号 加 1* / 


struct filex * fqd; /* 指向 文件 对 象 指针 数组 的 指针 x* / 


struct filex fd array[NR OPEN DEFAULT]; /x* 文 件 对 象 指 针 的 初始 化 数组 * / 
过 
进程 打开 文件 表 中 的 fd 字段 是 一 个 指向 文件 对 象 的 指针 数组 ,该 数组 的 长 度 存 放 在 
max_fds 字段 中 。 
对 于 在 fd 数组 中 的 每 个 元 素 对 应 一 个 的 文件 对 象 。 对 这 些 文 件 对 象 来 说 ,数组 的 索引 
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就 是 文件 描述 符 (file descriptor) 。 通 常 ,数组 的 第 一 个 元 素 ( 索 引 为 0) 是 进程 的 标准 输入 
文件 ,数组 的 第 二 个 元 素 (索引 为 1) 是 进程 的 标准 输出 文件 ,数组 的 第 三 个 元 素 ( 索 引 为 2) 
是 进程 的 标准 错误 文件 。 

Linux 进程 将 文件 描述 符 作 为 主 文件 标识 符 。 需 要 注意 ,两 个 文件 描述 符 可 以 指向 同 
一 个 打开 的 文件 ,也 就 是 说 ,数组 的 两 个 元 素 可 能 指向 同一 个 文件 对 象 。 

当 进 程 开 始 使 用 一 个 文件 对 象 时 , 它 调用 内 核 提供 的 fget() 函数 。 这 个 函数 接收 文件 
描述 符 fd 作为 参数 ,返回 在 current>files>fd[Lfd] 中 的 地 址 , 即 对 应 文件 对 象 的 地 址 ,如 果 
没有 任何 文件 与 fd 对 应 , 则 返回 NULL。 在 第 一 种 情况 下 ,fget() 把 引用 计数 器 f_count 的 
值 增 1。 

当 进 程 完 成 对 文件 对 象 的 使 用 时 ,调用 内 核 提供 的 fput 〇 函数 。 该 函数 将 文件 对 象 的 
地 址 作为 参数 ,并 减少 文件 对 象 引 用 计数 器 f_count 的 值 。 另 外 ,如 果 这 个 字段 变 为 0, 函数 
就 调用 文件 操作 的 release 方法 ,释放 相关 的 目录 项 对 象 和 文件 系统 描述 符 ,减少 索引 节点 
对 象 的 i_writecount 字段 的 值 (如 果 该 文件 是 可 写 的 )。 最 后 ,将 文件 对 象 从 “在 使 用 ”链表 
移 到 “未 使 用 ”链表 。 


10.4.3 进程 的 当前 目录 和 根 目 录 


在 UNIX 和 Linux 系统 中 ,每 一 个 进程 都 有 一 个 当前 工作 目录 和 它 自己 的 根 目 录 。 这 
是 进程 状态 的 一 部 分 ,以 便 用 户 既 可 以 使 用 相对 路 径 名 ,也 可 以 使 用 绝对 路 径 名 来 访问 所 需 
要 的 文件 。 

在 进程 描述 符 中 的 fs 域 就 是 用 来 维护 这 两 个 数据 。 这 是 一 个 指向 struct fs_struct 数 
据 结 构 的 指针 ,其 中 包含 指向 根 目录 和 当前 工作 目录 的 目录 项 结构 ,以 及 当前 工作 目录 和 根 
目录 的 文件 系统 对 象 。 


10.5 ext2 文件 系统 


10.5.1 ext2 文件 系统 的 存储 结构 


在 Linux 中 ,ext2 文件 系统 是 最 经 典 的 文件 系统 , 它 是 一 个 可 扩展 的 、 功 能 较 强 大 的 文 
件 系 统 。 内 核 使 用 ext2 文件 系统 作为 它 的 根 文件 系统 。 下 面 主 要 以 ext2 文件 系统 为 例 ， 
说 明 Linux 中 文件 系统 的 实现 。 

在 计算 机 中 ,程序 和 数据 以 文件 的 形式 在 存储 设备 中 保存 。 存 储 设备 包括 磁盘 、 磁 带 和 
光盘 等 。 通 常情 况 下 使 用 的 存储 设备 是 磁盘 。 在 Linux 系统 中 ,一 个 物理 存储 器 可 包含 一 
个 或 多 个 文件 系统 。 

文件 系统 由 每 块 512B 或 512B 的 任意 倍数 所 构成 的 逻辑 块 序 列 组 成 。 在 同一 个 文件 
系统 中 ,这 些 逻 辑 块 的 大 小 完全 相同 。 块 长 的 选取 将 直接 影响 设备 与 主 存 之 间 的 数据 传输 
速率 和 内 存 的 存储 能 力 。 大 的 块 长 将 使 得 内 存 和 设备 之 间 的 数据 传输 更 加 容易 ,但 反 过 来 
又 使 得 内 存 页 面 长 度 增加 ,从 而 影响 内 存 的 有 效 存储 能 

在 ext2 文件 系统 中 ,人 逻辑 块 的 大 小 (block-size) 可 以 是 1024B、2048B 或 4096B, 通 常 使 
用 4096B。 
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在 传统 的 UNIX 文件 系统 中 ,inode 节点 集中 存放 在 文件 系统 的 开始 处 (也 就 是 磁盘 开 
始 的 位 置 ) ,而 用 后 面 的 磁道 存放 文件 数据 块 。 这 样 ,即使 是 访问 一 个 很 短 的 文件 ,也 必须 两 
次 访问 磁盘 ,一 次 读 索引 节点 ,然后 再 读 文件 数据 块 ,在 两 次 磁盘 操作 中 需要 花费 较 长 的 寻 
道 时 间 , 这 就 形成 了 文件 系统 性 能 的 瓶颈 。 为 解决 这 个 问题 ,需要 对 文件 系统 的 存储 结构 进 
行 改造 。 在 ext2 文件 系统 中 ,磁盘 分 区 再 被 分 成 多 个 块 组 ,每 个 块 组 由 一 个 或 多 个 连续 的 
柱 面 组 成 。 每 个 柱 面 组 都 有 描述 本 组 磁盘 块 状态 信息 的 超级 块 (super block) ,同时 还 有 各 
自 的 索引 节点 表 和 空闲 块 表 。 这 样 文件 系统 就 可 以 把 与 索引 节点 相关 的 文件 数据 和 该 索引 
节点 存放 在 同一 柱 面 组 内 ,从 而 减少 磁盘 寻 道 时 间 , 提 高 效率 。 在 文件 被 创建 时 , 先 任 选 一 
个 节点 ,并 优先 在 该 节点 所 在 的 柱 面 组 中 分 配 数据 块 。 如 果 该 柱 面 组 不 存在 空闲 的 数据 块 ， 
就 在 其 相 邻 的 柱 面 组 中 分 配 。 

此 外 ,在 传统 的 UNIX 文件 系统 中 ,超级 块 只 存放 在 分 区 开始 的 位 置 ,也 就 是 引导 块 的 
后 面 。 为 增强 文件 系统 的 可 靠 性 , 即 在 磁盘 发 生 错误 的 时 候 能 够 恢复 系统 ,应 该 在 每 个 柱 面 
组 中 都 有 一 个 超级 块 的 备份 。 显 然 ,增强 文件 系统 的 可 靠 性 是 以 浪费 磁盘 空间 为 代价 的 。 

ext2 文件 系统 的 磁盘 逻辑 结构 如 图 10. 1 所 示 。 其 中 第 0# 块 是 引导 块 (poot block)。 
引导 块 中 装 有 引导 或 初 启 操作 系统 的 引导 代码 。 在 有 多 个 文件 系统 的 计算 机 系统 中 ,至 少 
有 一 个 文件 系统 的 引导 块 中 装 有 引导 代码 。 


引导 块 块 组 0 块 组 1 Re 块 组 n 


| 超级 块 | 组 描述 符 | 数据 块 位 图 | 索引 节点 位 图 | 索引 节点 表 | 。 数据 块 | 


图 10. 1 ext2 文件 系统 逻辑 磁盘 结构 


在 图 10. 1 中 可 以 看 到 ,ext2 文件 系统 将 一 个 逻辑 分 区 分 为 若干 个 块 组 (block group) 。 
每 个 块 组 中 都 包含 该 文件 系统 的 综合 信息 , 即 超级 块 和 组 描述 符 。 此 外 ,还 有 该 块 组 的 数据 
块 位 图 .索引 节点 (inode) 位 图 .索引 节点 表 以 及 数据 区 。 

在 加 载 文件 系统 时 ,实际 上 只 有 块 组 0 的 超级 块 和 组 描述 符 被 内 核 引用 ,而 其 他 块 中 的 
超级 块 和 组 描述 符 只 作为 备份 。 


10.5.2 ext2 文件 系统 主要 的 磁盘 数据 结构 


1. ext2 文件 系统 的 磁盘 超级 块 ext2_super_block 

在 ext2 文件 系统 的 每 个 块 组 中 都 保存 一 个 超级 块 。 在 块 设 备 作为 文件 卷 安装 时 ,内 核 
将 块 组 0 的 超级 块 的 内 容 读 到 内 存 超 级 块 中 ,以 使 得 对 文件 系统 的 操作 能 在 内 存 进行 。 描 
述 磁盘 上 ext2 超级 块 的 数据 结构 是 struct ext2_super_block。 下 面 说 明 这 个 结构 的 主要 
成 员 。 

字段 s_inode 存放 索引 节点 的 个 数 ,而 s_blocks_count 存放 ext2 文件 系统 的 总 块 数 。 
字段 s_log_block_size 用 2 的 究 次 表示 块 的 大 小 ,以 1024 为 单位 。 因 此 ,0 表示 1024B 的 
块 ,1 表示 2048B 的 块 ,等 等 。 
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s_blocks_per_group、s_frags_per_group 与 s_inodes_per_group 字段 分 别 存 放 每 个 块 
组 中 的 块 数 、 片 数 及 索引 节点 数 。 


struct ext2 super block { 


_ le32 s inodes count; /x* 索引 节 点 总 数 */ 
_ le32 s blocks count; /* 文 件 系统 总 块 数 x* / 
le32 sr blocks count; /* 保 留 的 块 数 */ 
_ le32 s free blocks count; /< 空闲 块 计数 器 * / 
le32 s free inodes count; /* 空闲 索引 节点 计数 器 x* / 
le32 s first data block; /* 第 一 个 数据 块 号 (总 是 1) * / 
_ le32 s log block size; /* 以 2 的 客 次 表示 的 块 大 小 x / 
le32 s log frag size; /* 以 2 的 短 次 表示 的 片 大 小 * / 
_ le32 s blocks per group; /* 一 个 块 组 中 的 块 数 x* / 
_le32 s frags per group; /* 一 个 块 组 中 的 片 数 x* / 
_ le32 s inodes per group; /* 一 个 块 组 中 的 索引 节点 数 * / 
_le32 s mtime; /* 最 后 一 次 挂 装 操作 的 时 间 * / 
_ le32 s wtime; /* 最 后 一 次 写 操 作 的 时 间 x* / 
_lel6 s mnt count; /* 挂 装 操作 计数 器 * / 
_lel6 s max mnt count; /* 最 大 挂 装 次 数 * / 
_ lel6 s magic; /* 魔 数 */ 
_lel6 5s state; /* 文 件 系统 状态 * / 
_ lel6 s errors; /* 错误 检查 时 的 动作 * / 
_lel6 5s minor rev level; /< 次 版 本 号 * / 
_ le32 s lastcheck; /* 最 后 一 次 文件 系统 检查 时 间 x* / 
_le32 s checkinterval; /* 两 次 检查 之 间 的 间隔 x* / 
_le32 s creator os; /* 创建 文件 系统 的 操作 函数 x* / 
_le32 s rev level; /* 版 本 号 * / 
_ lel6 s def resuid; /* 保 留 块 的 默认 UIDx / 
_ lel6 s def resgid; /* 保留 块 的 默认 GID* / 
_le32 s first ino; /* 第 一 个 保留 的 索引 节点 号 * / 
_lel6 $s inode size; /* 磁盘 索引 节点 的 大 小 * / 
_ lel6 s block group nr; /* 这 个 超级 块 的 块 组 号 * / 
_u8 suuiqd[16]; /* 128 位 文件 系统 标识 符 * / 
char s_volume name[16]; /* 文 件 系统 卷 名 * / 
_u32 s reserved[190]; /* 用 NULL 填充 到 块 末尾 * / 


}; 


2. ext2 的 块 组 描述 符 
每 个 块 组 有 自己 的 组 描述 符 , 用 来 描述 每 个 块 组 的 使 用 情况 。 组 描述 符 的 数据 结构 是 


struct ext2_group_desc。 


struct ext2 group desc 
{ 
_ le32 bg block bitmap; /< 块 位 图 的 块 号 * / 
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bg_inode bitmap; 

bg inode table; 

bg free blocks count; 
bg free inodes count; 
bg used dirs count; 
bg_pad; 

bg reserved[3]; 


3. 块 位 图 和 索引 节点 位 图 


在 每 个 块 组 中 使 用 了 两 个 块 来 分 别 记 录 本 组 内 各 个 数据 块 的 使 用 情况 和 索引 节点 表 的 
使 用 情况 ,这 两 个 块 分 别称 为 数据 块 位 图 和 索引 节点 位 图 。 其 中 数据 块 位 图 中 的 每 一 位 代 
表 一 个 数据 块 ,该 位 为 1, 表示 所 代表 的 数据 块 正在 使 用 ;为 0, 则 表示 该 数据 块 空闲 。 索 引 
节点 inode 块 位 图 用 来 记录 本 组 内 索引 节点 表 的 使 用 情况 ,其 中 某 一 位 为 1, 则 相应 的 节点 
块 念 ,否则 表示 空闲 。 显 然 在 对 ext2 文件 系统 进行 操作 时 离 不 开 这 两 个 位 图 。 

每 个 位 图 必须 存放 在 一 个 单独 的 块 中 。 如 果 块 大 小 为 4096B, 那 么 一 个 单独 的 位 图 可 


以 描述 32 768 个 块 的 状态 。 
4. ext2 文件 系统 的 磁盘 索引 节点 ext2_inode 


ext2 文件 系统 中 的 每 个 文件 对 应 一 个 描述 它 的 磁盘 数据 结构 , 即 磁盘 索引 节点 
(inode)。 磁 盘 索 引 节点 中 包含 文件 长 度 、 文 件 位 置 . 所 有 者 、 存 取 权 限 、 创 建 时 间 以 及 上 次 


/* 索引 节点 位 图 的 块 号 * / 


/* 第 一 个 索引 节点 表 块 的 块 号 * / 


/* 组 中 空闲 块 的 个 数 * / 


/* 组 中 空闲 索引 节点 的 个 数 * / 


/* 组 中 目录 的 个 数 * / 
/x* 按 字 对 齐 * / 
/* 用 null 填充 x*/ 


访问 时 间 等 信息 。 磁 盘 索 引 节 点 的 数据 结构 是 struct ext2_inode。 


struct ext2_inode { 


_lel6 
_lel6 
_le32 
_le32 
le32 
_l1e32 
le32 
_lel6 
_lel6 
le32 
le32 


i_ mode; 

i uid; 

i size; 

i atime; 

i ctime; 

i mtime; 

i dtime; 
EM 

i links count; 
i blocks; 


i flags; 


union { 
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struct { 

_le32 1 i reservedl; 
} 1inuxl} 
EE 攻 

_le32 h i translator; 
yhuradls 
struct { 

_le32 m i reservedl; 


} masixl; 


/* 文 件 类 型 及 访问 权限 * / 
/* 文 件 属 主 的 UID* / 

/* 以 字 节 为 单位 的 文件 长 度 * / 
/* 最 后 一 次 访问 时 间 x* / 
/* 文 件 创建 时 间 */ 

/* 最 后 一 次 修改 时 间 x* / 
/* 删除 时 间 x* / 

/* 文 件 属 主 的 GID* / 

/* 链接 数 * / 

/* 文 件 的 数据 块 数 * / 

/* 文 件 标志 * / 


Faasdls /* 特定 的 操作 系统 的 信息 * / 
_ le32 i block[EXT2 N_BLOCKS]; /* 数 据 块 指针 x*/ 


}; 

其 中 ,文件 模式 i_mode 表示 文件 类 型 (普通 文件 .目录 文件 、 块 设备 .字符 设备 或 FIFO 
文件 ) 和 访问 权限 ,而 用 户 标识 符 i_uid 以 及 组 标识 符 i_gid 定义 对 该 文件 具有 存 取 权 的 用 
户 集合 , 与 该 索引 节点 链接 的 文件 数 i_links_count 表示 有 和 多少 个 不 同 的 文件 名 指向 该 文 
件 。 另 外 ,该 文件 所 用 的 物理 块 指 针 是 一 个 数组 i_block[EXT2_N_BLOCKS], 它 指明 文件 
数据 安放 在 逻辑 盘 上 的 位 置 。 有 关 文 件数 据 的 盘 块 安放 与 寻 址 的 方法 将 在 后 面 介绍 。 

索引 节点 表 由 一 串 连续 的 块 组 成 ,每 个 ext2 磁盘 索引 节点 占用 128B。 因 此 ,一 个 长 
4096B 的 块 可 存放 32 个 磁盘 索引 项 。 每 个 块 组 中 的 索引 节点 总 数 存放 在 磁盘 超级 块 的 成 


员 s_inodes_per_group 中 。 
10.5.3 ext2 文件 系统 的 内 存 数据 结构 


ext2 文件 系统 的 磁盘 组 织 和 内 核 组 织 并 不 完全 相同 。 这 主要 是 因为 使 用 磁盘 和 内 存 
的 考虑 角度 不 同 。 对 于 磁盘 上 存储 的 数据 结构 来 说 ,主要 是 考虑 如 何 节省 磁盘 空间 ;而 对 于 
内 存 中 存储 的 数据 结构 来 说 , 主要 是 考虑 系统 运行 的 效率 和 性 能 。 因 此 ,ext2 的 内 存 索 引 
节点 和 磁盘 索引 节点 的 数据 结构 不 完全 相同 。ext2 磁盘 数据 结构 ext2_super_block 和 
ext2_inode 分 别 对 应 ext2 内 存 数据 结构 ext2_sb_info 和 ext2_inode_info。 

在 内 核 挂 装 ext2 文件 系统 时 ,ext2 分 区 上 的 磁盘 数据 结构 中 的 大 部 分 信息 被 读 入 , 填 
写 到 内 存 中 相应 的 数据 结构 中 。 然 后 ,内 核 通 过 对 位 于 内 存 中 的 超级 块 和 索引 节点 的 操作 
来 实现 文件 系统 的 各 种 功能 。 

1. ext2 的 内 存 超 级 块 

当 内 核 安装 ext2 文件 系统 时 ,首先 从 磁盘 上 读 取 磁盘 超级 块 ext2_super_block 结构 体 
的 内 容 ,填充 类 型 为 ext2_sb_info 的 内 存 超级 块 , 并 将 后 者 的 指针 写 人 VFS 超级 块 的 s_fs_ 
info 域 , 完 成 从 虚拟 文件 系统 到 ext2 文件 系统 的 转变 。 磁 盘 超 级 块 内 容 一 旦 被 读 入 内 存 ， 
将 一 直 保 留 ,直到 该 文件 系统 被 和 卸载 。 

为 了 保证 内 核能 够 找 出 挂 装 的 ext2 文件 系统 相关 内 容 , 内 存 超级 块 ext2_sb_info 包含 
下 列 信息 : 

。 磁盘 超级 块 字段 的 大 部 分 内 容 ; 

。 块 位 图 高 速 缓存 ; 
索引 节点 位 图 高 速 缓存 ; 
s_sbh 指针 ,指向 磁盘 超级 块 所 在 缓冲 区 的 首部 ; 
。 s_cs 指针 ,指向 磁盘 超级 块 所 在 的 缓冲 区 ; 
。 组 描述 符 的 个 数 ; 
s_group_desc 指针 ,指向 组 描述 符 所 在 的 缓冲 区 的 首部 的 数组 ; 
其 他 与 安装 状态 .安装 选项 等 相关 的 数据 。 
2. ext2 的 内 存 索 引 节 点 
同样 地 , 当 VFS 要 处 理 属于 ext2 文件 的 索引 节点 时 ,从 磁盘 上 读 取 ext2_inode 结构 ， 

“和 


填充 到 索引 节点 描述 符 ext2_inode_info 数据 结构 中 。 该 结构 包含 下 列 信息 : 
。 整个 VFS 索引 节点 ; 
。 在 磁盘 索引 节点 结构 中 而 不 在 一 般 的 VFS 索引 节点 对 象 中 的 大 部 分 字段 ; 
。 片 的 大 小 和 片 数 (还 未 使 用 ); 
。 索引 节点 所 在 块 组 的 i_block_group 块 组 索引 ; 
。 i_prealloc_block 和 i_prealloc_count 字段 ,在 为 数据 块 进行 预 分 配 中 使 用 ; 
。 i_osync 字段 ,是 一 个 标志 ,表示 是 否 同 步 地 更 新 磁盘 索引 节点 。 


10.5.4 数据 块 寻 址 


每 个 非 空 的 普通 文件 都 由 一 组 数据 块 组 成 。 由 于 ext2 文件 的 数据 块 在 磁盘 上 不 一 定 
是 相 邻 的 ,因此 ,ext2 文件 系统 必须 提供 一 种 方法 ,用 这 种 方法 可 以 在 磁盘 上 建立 每 个 文件 
块 号 与 相应 逻辑 块 号 之 间 的 关系 。 

磁盘 索引 节点 ext2_inode 的 i_block 字段 是 一 个 有 EXT2_N_BLOCKS 个 元 素 的 数组 。 
EXT2_N_BLOCKS 的 默认 值 为 15。 这 个 数组 实现 了 文件 块 到 磁盘 逻辑 块 的 转换 ,如 图 10. 2 
所 示 。 这 个 数组 表示 一 个 大 型 数据 结构 的 初始 化 部 分 。 数 组 的 15 个 元 素 有 4 种 不 同 的 类 型 : 
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图 10.2 文件 映射 关系 


。 最 初 的 12 个 元 素 包 含 的 逻辑 块 号 与 文件 最 初 的 12 个 块 对 应 , 即 对 应 的 文件 块 号 为 
Qs11, 
。 下 标 12 的 元 素 包 含 一 个 块 的 逻辑 块 号 ,这 个 块 表示 让 辑 块 号 的 一 个 二 级 数组 。 这 
个 数组 的 元 素 对 应 的 文件 块 号 从 12 到 b/4 十 11, 这 里 5b 是 文件 系统 的 块 大 小 (每 个 
。 252 。 


逻辑 块 号 占 4B, 因 此 需要 除 以 4)。 因 此 ,内 核 为 了 查找 指向 数据 块 的 指针 必须 先 访 
问 这 个 元 素 ,然后 ,用 另 一 个 指向 最 终 块 (包含 文件 内 容 ) 的 指针 访问 那个 块 。 
。 下 标 13 的 元 素 包 含 一 个 块 的 逻辑 块 号 ,而 这 个 块 包含 逻辑 块 号 的 一 个 二 级 数组 ,这 
个 二 级 数组 的 数组 项 依次 指向 三 级 数组 ,这 个 三 级 数组 存放 的 才 是 文件 块 对 应 的 逻 
辑 块 号 ,范围 从 /4 十 12 到 (6/4)? 十 (5/4) 十 11。 
。 下 标 14 的 元 素 使 用 三 级 间接 索引 ,第 四 级 数组 中 存放 的 才 是 文件 块 号 对 应 的 逻辑 
块 号 ,范围 从 (6/4)? 十 (5/4) 十 12 到 (b/4)3 十 (8/4)2 十 (8/4) 十 11。 
如 果 文 件 需 要 的 数据 块 小 于 12, 那 么 两 次 访问 磁盘 就 可 以 检索 到 所 需 的 数据 : 一 次 是 
读 磁盘 索引 节点 i_block 数组 的 一 个 元 素 , 另 一 次 是 读 所 需要 的 数据 块 。 对 于 大 文件 来 说 ， 
可 能 需要 三 四 次 的 磁盘 访问 才能 找到 需要 的 块 。 实 际 上 ,这 是 一 种 最 坏 的 估计 ,因为 索引 节 
点 ` 缓 冲 区 及 页 高 速 缓存 都 有 助 于 极 大 地 减少 实际 访问 磁盘 的 次 数 。 
文件 系统 的 块 大 小 也 会 影响 寻 址 机 制 ,因为 大 的 块 允许 ext2 把 更 多 的 逻辑 块 号 存放 在 
一 个 单独 的 块 中 。 表 10. 1 显示 了 每 种 块 大 小 和 每 种 寻 址 方式 所 存放 文件 大 小 的 上 限 。 在 
任何 情况 下 ,ext2 文件 系统 都 把 文件 大 小 的 上 限 置 为 2TB 一 4096B。 


表 10.1 块 大 小 与 其 寻 址 方式 所 存放 文件 大 小 的 上 限 对 应 表 


块 大 小 直接 索引 一 级 间接 索引 二 级 间接 索引 三 级 间接 索引 


1024B 12KB 268KB 64.26MB 16. 06GB 
2048B 24KB 1. 02MB 513. 02MB 256. 5GB 
4096B 48KB 4. 04MB 4GB 2TB 


10.6 块 设备 驱动 


Linux 系统 中 的 设备 可 分 为 两 类 , 即 块 设备 和 字符 设备 。 管 理 这 些 设 备 的 程序 模块 被 
称 为 IO 子 系统 。1/O 子 系统 控制 完成 进程 与 外 设 之 间 的 通信 任务 。 其 中 IO 子 系统 的 核 
心 部 分 是 控制 外 设 的 设备 驱动 程序 。 本 节 主 要 介绍 Linux 系统 的 块 设备 驱动 原理 。 

虽然 设备 文件 也 在 系统 的 目录 树 中 ,但 是 它们 和 普通 文件 以 及 目录 文件 有 根本 的 不 同 。 
当 进 程 访问 普通 文件 时 , 它 会 通过 文件 系统 访问 磁盘 分 区 中 的 一 些 数据 块 ;而 在 进程 访问 设 
备 文件 时 , 它 只 要 驱动 硬件 设备 就 可 以 了 。VFS 的 责任 是 为 应 用 程序 隐藏 设备 文件 与 普通 
文件 之 间 的 差异 。 

为 了 做 到 这 一 点 ,VFS 在 设备 文件 打开 时 改变 其 默认 文件 操作 。 因 此 ,VFS 把 设备 文 
件 的 每 个 系统 调用 都 转换 成 与 设备 相关 的 函数 的 调用 ,而 不 是 对 文件 系统 相应 函数 的 调用 。 


10.6.1 设备 配置 


在 Linux 系统 中 ,每 一 类 设备 都 有 自己 的 驱动 程序 。 而 且 , 每 个 设备 都 有 自己 唯一 的 设 
备 名 ,并 能 像 文件 那样 对 其 进行 存 取 操 作 。 因 此 ,每 个 设备 都 作为 特殊 文件 在 文件 系统 目录 
树 中 占据 一 个 节点 ,只 是 其 索引 节点 的 类 型 与 普通 文件 不 同 而 已 。 不 过 , 当 文 件 系统 中 增加 
一 个 普通 文件 时 ,可 以 用 系统 调用 create 来 创建 该 文件 。 那 么 ,怎么 样 来 创建 一 个 设备 特殊 
文件 呢 ? 
二 :电光 


进入 Linux 目录 树 的 /dev 目录 ,可 以 看 到 在 里 面 已 经 准备 好 了 常用 的 设备 文件 。 目 
前 , 越 来 越 多 的 Linux 发 行 版 开始 使 用 udev 技术 , 当 内 核 增加 一 个 新 的 设备 驱动 模块 时 ,会 
自动 在 /dev 目录 中 创建 相应 的 设备 文件 。 

如 果 一 个 新 设备 和 系统 连接 ,需要 建立 新 的 设备 文件 ,就 要 依靠 系统 管理 员 使 用 相应 的 
命令 ,例如 mknod 来 建立 特殊 文件 。 

mknod 命令 要 求 管理 员 提 供 文 件 名 、 文 件 类 型 ( 块 设备 或 字符 设备 )、 主 设备 号 和 次 设 
备 号 。 例 如 : 


mknod /dev/ttyl c 41 


创建 一 个 设备 名 为 /dev/ttyl 的 虚拟 终端 设备 (c 代表 字符 设备 文件 ,b 代表 块 设备 文件 ) ,该 
设备 的 主 设备 号 是 4, 次 设备 号 是 1。 在 Linux 系统 中 , 主 设备 号 指示 一 种 设备 类 型 ,而 次 设 
号 则 表示 该 类 设备 的 一 个 单元 。 


10.6.2 设备 驱动 程序 的 接口 


块 设备 驱动 程序 把 一 个 逻辑 设备 号 和 块 号 组 成 的 文件 系统 地 址 转换 成 物理 设备 上 特定 
的 物理 块 号 ,并 启动 物理 设备 和 控制 器 进行 W/O 传输 工作 。 驱 动 程序 有 两 个 接口 : 与 文件 
系统 的 接口 以 及 与 硬件 的 接口 。 

我 们 知道 ,在 设备 文件 上 发 出 的 每 个 系统 调用 都 由 内 核 转化 为 相应 设备 驱动 程序 的 对 
应 函数 的 调用 。 为 了 完成 这 个 操作 ,设备 驱动 程序 必须 注册 自己 。 如 果 设 备 驱 动 程序 被 静 
态 地 编译 进 内 核 , 则 它 的 注册 在 内 核 初始 化 阶段 进行 ;而 如 果 驱 动 程序 作为 一 个 内 核 模块 来 
编译 , 则 它 的 注册 在 模块 装 入 时 进行 。 在 后 一 种 情况 下 ,设备 驱动 程序 也 可 以 在 模块 卸载 时 
注销 自己 。 已 经 注册 的 设备 驱动 程序 存放 在 一 个 散 列表 中 。 

用 于 块 设 备 文件 的 默认 的 文件 操作 方法 如 表 10. 2 所 示 。 

表 10.2 用 于 块 设备 文件 的 默认 操作 方法 


方法 用 于 块 设备 文件 的 函数 方法 用 于 块 设备 文件 的 函数 


open blkdev_open() write generic_file_ write() 
release blkdev_close() mmap generic_file_ mmap() 


llseek block_llseek() fsync block_fsync() 


read generic file_read() ioctl blkdev_ioctl() 


另外 ,硬件 与 驱动 程序 的 接口 是 由 机 器 的 有 关 控 制 寄存 器 或 操纵 设备 的 IO 指令 以 及 
中 断 向 量 组 成 的 。 对 硬件 1/O 的 监控 可 以 采用 轮 询 模式 或 中 断 模式 。 当 一 个 设备 控制 器 
发 出 中 断 请 求 时 ,系统 识别 发 出 中 断 请 求 的 设备 ,并 调用 适当 的 中 断 处 理 程序 。 

驱动 程序 与 文件 系统 和 硬件 的 接口 如 图 10. 3 所 示 。 

对 于 块 设备 , 当 文件 系统 调用 有 关系 统 调用 时 ,系统 从 文件 描述 符 fd 找到 对 应 的 VFS 
内 存 索引 节点 。 从 索引 节点 信息 中 可 以 检查 文件 类 型 ,从 索引 节点 中 抽出 主 设备 号 和 次 设 
备 号 。 使 用 主 设备 号 和 次 设备 号 ,可 以 从 散 列 表 中 查找 出 块 设备 驱动 程序 。 

接着 ,系统 调用 设备 驱动 程序 所 提供 的 open 方法 ,打开 对 应 的 设备 。 该 驱动 程序 使 调用 
进程 和 被 打开 设备 之 间 建 立 联系 ,并 初始 化 其 他 驱动 程序 用 的 数据 结构 。 返 回 之 前 当然 还 要 
检查 打开 的 合法 性 ,例如 ,不 能 同时 有 几 个 进程 打开 同一 个 打印 机 设备 进行 读 写 操作 等 。 

。 254 。 


文件 系统 


open close read write ioctl open close read write 


字符 设备 开关 表 缓冲 区 管理 
块 设备 开关 表 
字符 设备 驱动 程序 块 设备 驱动 程序 
中 断 处 理 程序 中 断 处 理 程序 
中 断 向 量 中 断 向 量 
设备 中 断 


图 10.3 驱动 程序 及 其 接口 


打开 一 个 设备 相当 于 为 一 个 进程 分 配 一 个 设备 。 显 然 ,在 使 用 缓冲 池 的 文件 系统 中 , 除 
了 刚 开 始 时 需要 打开 磁盘 设备 之 外 ,在 缓冲 区 和 磁盘 块 之 间 进 行 /O 传输 时 不 必 打 开 
设备 。 

系统 调用 close 断 开 用 户 进 程 与 一 个 设备 的 连接 。 注 意 , 只 有 当 没 有 其 他 进程 打开 此 
设备 时 才 可 以 调用 关闭 过 程 ,否则 会 引起 混乱 。 

关闭 一 个 设备 文件 相当 于 释放 一 个 进程 所 占有 的 设备 。 

块 设备 有 两 种 基本 的 W/O 数据 传送 方式 ,分 别 是 块 IO 操作 和 页 I/O 操作 。 函 数 
bread() 从 块 设备 读 取 一 个 单独 的 块 , 并 存放 在 缓冲 区 中 。 它 首先 检查 缓冲 区 中 是 否 已 经 有 
所 需要 的 数据 ,如 果 没 有 ,调用 ll_rw_block() 函 数 开 始 读 操作 。 同 时 ,调用 wait_on_buffer() 函 
数 进行 等 待 , 这 个 函数 把 current 进程 插入 b_wait 等 待 队列 ,并 挂 起 ,直到 缓冲 区 开锁 。 

设备 与 驱动 程序 的 通信 方法 依赖 于 硬件 。 一 般 计 算 机 中 大 都 设置 有 状态 控制 寄存 器 和 

数据 缓冲 寄存 器 。 在 数据 缓冲 寄存 器 的 数据 发 送 完毕 之 后 ,状态 控制 器 将 会 通过 总 线 发 出 
传输 完成 中 断 信号 ,从 而 引起 系统 执行 一 个 中 断 处 理 程序 。 至 于 执行 哪 一 个 中 断 处 理 程序 ， 
则 要 根据 发 出 中 断 的 设备 和 中 断 向 量 来 决定 的 。 一 般 来 说 ,中 断 向 量 所 对 应 的 中 断 处 理 程 
序 都 是 针对 一 类 设备 的 ,系统 在 调用 设备 中 断 处 理 程 序 时 必须 将 设备 号 和 其 他 有 关 参 数 传 
递 给 它 ,以 便 识别 引起 中 断 的 特定 设备 单元 。 

总 之 , 块 设备 驱动 程序 必须 把 由 逻辑 设备 号 和 块 号 组 成 的 文件 逻辑 地 址 翻译 成 块 设备 
上 的 特定 物理 地 址 ,并 启动 块 设备 和 相应 的 控制 器 来 进行 IO 传输 工作 。 在 传输 完成 时 还 
要 接收 中 断 信号 并 完成 相应 的 中 断 处 理 。 


10.7 字符 设备 驱动 


字符 设备 是 指 在 IO 传输 过 程 中 以 字符 为 单位 进行 传输 的 设备 ,例如 键盘 .打印 机 等 。 
在 UNIX/Linux 系统 中 ,字符 设备 以 字符 特殊 文件 的 方式 在 文件 目录 中 占据 一 个 席位 并 拥 
有 相应 的 索引 节点 。 与 块 设备 一 样 ,索引 节点 中 的 文件 类 型 指明 该 索引 节点 所 说 明 的 是 一 
个 字符 文件 ,用 户 可 以 用 与 块 设备 相同 的 方式 打开 .关闭 和 读 写字 符 特 殊 文件 。 
字符 设备 是 Linux 设备 中 最 简单 的 一 种 。 应 用 程序 可 以 和 存 取 文 件 相同 的 系统 调用 来 
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打开 、 读 写 及 关闭 它 。 与 块 设备 相似 ,字符 设备 的 驱动 程序 也 需要 在 内 核 中 注册 。 内 核 使 用 
字符 设备 的 主 设备 号 和 次 设备 号 来 索引 设备 驱动 程序 的 散 列 表 。 

用 于 字符 设备 的 文件 操作 只 有 一 个 , 即 打开 文件 操作 chrdev_open。 这 TS 
符 设备 的 设备 号 在 散 列表 中 查找 对 应 元 素 , 重 写 文件 对 象 的 f_op 字段 。 然 后 ,这 个 函数 调 
用 相应 的 驱动 程序 的 open 方法 来 初始 化 驱动 程序 。 

一 旦 字符 设备 文件 被 打开 , 则 通常 用 于 读 和 /或 写 访问 ;为 了 做 到 这 点 ,文件 对 象 的 
read 和 write 方法 执行 设备 驱动 程序 的 适当 函数 。 大 多 数 设 备 驱 动 程序 也 通过 ioctl 方法 
支持 ioctl() 调 用 ,该 调用 允许 把 特殊 的 命令 发 往 基 本 的 硬件 设备 。 
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Linux 系统 中 所 有 的 文件 被 组 织 到 一 个 统一 的 树 形 目录 结构 ,除了 树 形 目录 结构 外 ， 
Linux 文件 系统 还 具有 4 个 特点 ,包括 文件 是 无 结构 的 字符 流 式 文件 ,文件 可 动态 地 增长 或 
减少 ,文件 数据 可 由 文件 拥有 者 设置 相应 的 访问 权限 而 受 保 护 , 外 部 设备 也 被 看 成 文件 。 
Linux 文件 可 以 分 为 普通 文件 .目录 文件 .设备 文件 (字符 设备 文件 和 块 设备 文件 )\ 有 名 管 
道 (FIFO) 、 软 链接 和 UNIX 域 套 接 字 6 种 类 型 。 

为 了 支持 多 种 不 同 的 文件 系统 ,Linux 内 核 使 用 虚拟 文件 系统 (VFS) 框 架 ,由 超级 块 
(Csuperblock) .索引 节点 (inode) ,文件 (file) 和 目录 项 (dentry) 等 对 象 组 成 。VFS 是 位 于 程 
序 和 具体 文件 系统 之 间 的 软件 层 , 它 隐藏 了 各 种 硬件 的 具体 细节 ,实现 了 与 文件 系统 相关 的 
所 有 系统 调用 ,为 各 种 文件 系统 提供 了 通用 接口 ,应 用 程序 只 需 与 VFS 进行 交互 ,而 不 用 关 
心 文件 系统 的 实现 细节 。 借 助 于 VFS, 不 同 的 文件 系统 可 通过 注册 、 挂 载 加 入 到 Linux 系 
统 中 ,被 用 户 所 使 用 。 目 前 ,Linux 可 为 多 种 类 型 的 文件 系统 提供 支持 ,包括 基于 磁盘 的 文 
件 系统 、 基 于 网 络 的 文件 系统 和 特殊 的 文件 系统 等 。 

在 访问 文件 之 前 ,进程 必须 首先 打开 文件 ,通过 该 文件 描述 符 与 相对 应 的 文件 或 物理 设 
备 相关 联 ,files 域 用 来 记录 和 控制 进程 当前 打开 的 文件 。 当 进程 开始 使 用 一 个 文件 对 象 
时 ,调用 内 核 提供 的 fget() 函 数 获得 对 应 文件 对 象 的 地 址 ,调用 fput() 函 数 或 release 方法 
释放 相关 目录 项 对 象 和 文件 系统 描述 符 , 将 文件 对 象 从 “在 使 用 ”链表 移 到 “未 使 用 ”链表 。 
每 个 进程 都 有 一 个 当前 工作 目录 和 它 自己 的 根 目录 ,并 可 以 采用 相对 路 径 名 或 绝对 路 径 名 
来 访问 所 需要 的 文件 。 

ext2 文件 系统 是 Linux 系统 中 最 经 典 的 文件 系统 , 它 是 一 个 可 扩展 的 ,功能 较 强 的 文 
件 系统 。 在 ext2 文件 系统 中 ,磁盘 分 为 块 组 ,每 个 块 组 由 一 个 或 多 个 连续 的 柱 面 组 成 ,每 个 
柱 面 组 由 一 个 超级 块 (superblock) 描述 本 组 磁盘 块 状态 信息 ,同时 还 有 各 自 的 索引 节点 表 
和 空闲 块 。 描 述 超级 块 的 数据 结构 是 ext2_super_block; 每 个 块 组 中 有 描述 块 组 使 用 情况 
的 数据 结构 ext2_group_desc, 数 据 块 位 图 和 索引 节点 位 图 分 别 记录 本 块 组 各 数据 块 和 索引 
节点 表 的 使 用 情况 ;数据 结构 ext2_inode 描述 了 每 个 文件 的 磁盘 数据 结构 , 即 磁盘 索引 节 
点 (inode)。 另 外 ,ext2 文件 系统 中 还 设置 了 内 存 超级 块 和 内 存 索 引 节 点 来 描述 文件 在 内 核 
中 的 存储 情况 。 

块 设 备 和 字符 设备 都 是 以 特殊 文件 的 形式 在 Linux 文件 系统 中 存在 ,因此 ,在 使 用 块 设 
备 或 字符 设备 时 ,首先 要 将 驱动 程序 在 内 核 中 注册 ,然后 利用 系统 提供 的 虚拟 文件 系统 接口 
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来 访问 。 


DW 


习 题 


Linux 文件 系统 的 特点 是 什么 ?简单 描述 一 个 典型 的 Linux 系统 的 目录 结构 。 
Linux 的 文件 类 型 有 几 种 ?分 别 是 什么 ? 

什么 是 VFS? 它 有 什么 作用 ? 其 通用 数据 模型 是 什么 ? 

VFS 包括 哪些 系统 调用 ? 分 别 简 述 其 功能 。 

简 述 文件 系统 的 注册 、 挂 装 以 及 务 载 过 程 。 

ext2 文件 系统 的 数据 块 寻 址 是 如 何 实现 的 ? 

Linux 系统 中 的 设备 可 分 为 几 种 ? 分 别 是 什么 ? 
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第 11 章 Windows 的 设备 管理 和 文件 系统 


Windows 设备 管理 的 对 象 包括 除 处 理 器 和 内 存 之 外 的 大 多 数 硬 件 设备 ,如 交互 设备 、 
外 存 设备 和 终端 设备 等 。 计 算 机 的 存储 器 由 内 存 和 外 存 组 成 ,处 理 器 可 以 通过 总 线 控制 器 
直接 对 内 存 进行 寻 址 访问 ,但 需要 通过 设备 驱动 才能 对 外 存 进行 操作 。 因 此 , Windows 将 
外 存 看 作 一 种 特殊 的 设备 ,外 存 管理 是 Windows 设备 管理 的 重要 组 成 部 分 。 在 外 存 管理 的 
基础 之 上 ,Windows 构建 了 多 种 格式 的 文件 系统 。 


11.1 Windows IO 系统 的 结构 


Windows 管理 的 设备 主要 是 完成 计算 机 和 外 界 进行 交互 的 输入 /输出 设备 ,因此 将 操 
作 系 统 的 设备 管理 服务 称 为 I/O( 输 入 /输出 ) 系 统 。 本 节 介 绍 Windows 1/O 系统 的 设计 目 
标 及 设备 管理 服务 的 系统 结构 。 


11.1.1 设计 目标 


Windows I/O 系统 为 应 用 程序 和 操作 系统 服务 提供 了 一 个 操作 设备 的 抽象 层 , 它 由 若 
干 个 运行 在 核心 态 的 系统 服务 组 成 。 可 以 从 Windows I/O 系统 的 设计 目标 来 了 解 它 的 主 
要 特点 : 
为 所 有 的 设备 提供 统一 的 安全 和 命名 机 制 , 以 方便 这 些 资 源 的 共享 。 
提供 基于 包 交 换 的 高 效 异步 W/O 请 求 处 理 机 制 , 以 提高 应 用 与 设备 交互 的 效率 。 
为 使 用 高 级 语言 编写 设备 驱动 程序 提供 支持 ,以 便 在 不 同体 系 结构 的 计算 机 之 间 移 
植 驱动 程序 。 
支持 可 扩展 的 分 层 驱 动 程序 结构 ,以 方便 对 设备 管理 功能 的 扩充 和 修改 。 
支持 驱动 程序 的 动态 加 载 和 和 缀 载 ,以 最 大 程度 地 节省 系统 资源 。 
提供 即 插 即 用 的 功能 ,使 得 系统 能 够 自动 侦 测 新 的 硬件 设备 ,并 自动 分 配 必要 的 系 
提供 电源 管理 功能 ,使 得 系统 和 相关 的 设备 在 不 使 用 时 可 以 进入 低 功 耗 状 态 。 
支持 多 个 可 安装 的 文件 系统 ,包括 文件 分 配 表 文件 系统 (FAT)、CD-ROM 文件 系统 
(CDFS) .通用 磁盘 格式 文件 系统 CUDF) 和 NT 文件 系统 (NTFS)。 


11.1.2 设备 管理 服务 


如 图 11. 1 所 示 ,由 多 个 运行 在 核心 态 的 系统 服务 与 设备 驱动 程序 一 起 完成 设备 管理 ， 
它们 在 体系 结构 上 可 以 分 为 3 个 层次 : 最 低层 是 硬件 抽象 层 , 它 为 操作 系统 服务 提供 了 一 
个 对 主板 上 的 设备 的 逻辑 封装 ,如 处 理 器 和 中 断 控 制 器 等 ;在 其 上 为 设备 驱动 层 , 它 为 计算 
机 操作 外 接 硬件 设备 提供 了 一 个 逻辑 接口 ;再 往 上 是 设备 管理 层 , 它 实现 对 所 有 计算 机 外 部 
设备 的 管理 ,并 为 用 户 态 的 应 用 提供 操作 设备 的 接口 。 
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图 11.1 Windows 设备 管理 体系 结构 


下 面 简 单 地 介绍 构成 设备 管理 服务 的 各 部 分 的 功能 。 

1. 1/O 管理 器 (1/O Manager) 

它 是 Windows 1/O 系统 的 核心 ,提供 支持 Windows 设备 驱动 程序 的 系统 结构 。 它 将 
应 用 的 1/O 请 求 传递 到 相应 的 设备 驱动 程序 ,并 将 处 理 的 结果 返回 给 应 用 。 

2. 即 插 即 用 管理 器 (PnP Manager) 

它 和 1/0O 管理 器 以 及 总 线 管理 驱动 一 起 ,检测 硬件 设备 的 加 入 和 移出 ,并 分 配 相应 的 
硬件 资源 。 

3. 电源 管理 器 (Power Manager) 

它 和 I/O 管理 器 以 及 相应 的 设备 驱动 程序 一 起 ,管理 该 设备 的 能 耗 状态 。 

4. 设备 驱动 程序 (Device Driver) 

它 为 访问 特定 的 设备 提供 一 个 LO 接口 ,设备 驱动 从 W/O 管理 器 得 到 处 理 指令 ,在 处 
理 完 后 会 通知 1/O 管理 器 。 如 果 需 要 其 他 的 设备 驱动 协助 完成 指令 ,设备 驱动 程序 会 通过 
WO 管理 器 将 指令 转 到 相关 的 设备 驱动 程序 。 

Ss. 注册 表 (Registry) 和 INF 文件 

注册 表 记 录 了 和 系统 相连 的 硬件 设备 描述 以 及 初始 化 和 配置 信息 ,INF 文件 是 用 来 安 
装 相 关 设 备 驱 动 程序 的 文件 。 

6. 硬件 抽象 层 (Hardware Abstraction Layer, HAL) 

它 为 设备 驱动 程序 提供 一 个 和 计算 机 主板 硬件 无 关 的 抽象 层 , 使 得 设备 驱动 程序 可 以 
通过 统一 的 接口 来 访问 计算 机 主板 上 的 设备 ,而 不 用 考虑 不 同 计算 机 在 硬件 配置 上 的 差别 。 


11.2 设备 驱动 程序 和 IO 处 理 


设备 驱动 程序 是 Windows 1/O 系统 中 直接 和 硬件 设备 交互 的 部 分 ,设备 管理 层 的 服务 
通过 它们 来 完成 具体 的 IO 请 求 处 理 过 程 。 本 节 介 绍 设备 驱动 程序 的 分 类 和 基本 构成 ,并 
通过 对 Windows 1/O 处 理 的 过 程 分 析 来 说 明 它 的 工作 原理 。 
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11.2.1 设备 驱动 类 型 和 结构 


如 上 节 所 述 , 大 部 分 的 设备 驱动 程序 运行 在 核心 态 , 可 以 按照 它们 不 同 的 性 质 分 为 下 面 
的 3 个 大 类 : 

(1) 文件 系统 驱动 。Windows 的 文件 系统 是 通过 驱动 程序 来 实现 的 , 它 构建 在 外 存 管 
理 的 基础 之 上 。 它 接受 对 文件 操作 的 请 求 ,并 将 这 些 请 求 翻译 成 具体 的 外 存 设备 的 操作 
命令 。 

(2) 即 插 即 用 设备 驱动 。 它 们 和 硬件 设备 直接 交互 ,并 和 Windows 即 插 即 用 管理 器 一 
起 工作 ,来 完成 对 设备 的 管理 。 这 类 驱动 管理 的 常见 设备 有 大 容量 存储 设备 、 视 频 适 配器 、 
输入 设备 和 网 络 适配器 等 。 

(3) 非 即 插 即 用 设备 驱动 。 这 类 驱动 不 直接 和 硬件 设备 打交道 ,而 是 为 用 户 态 的 应 用 
访问 核心 态 的 服务 和 驱动 提供 接口 。 这 类 驱动 又 被 称 作 内 核 扩展 ,常见 的 这 类 设备 驱动 有 
网 络 接口 和 协议 驱动 。 

Windows 设备 驱动 是 一 组 例 程 的 集合 ,1/O 控制 器 通过 调用 它们 来 完成 IO 请 求 的 处 
理 。 在 操作 系统 中 ,设备 驱动 由 一 个 驱动 对 象 来 表示 ,LI/O 管理 器 在 调和 人 设备 驱动 时 创建 该 
对 象 。 一 个 典型 的 Windows 设备 驱动 常常 包括 下 面 的 例 程 : 
初始 化 例 程 。 当 1/O 管理 器 将 设备 驱动 程序 调和 人 操作 系统 时 ,会 调用 该 例 程 。 该 例 
程 通过 填写 相应 的 系统 数据 结构 来 注册 该 设备 驱动 的 其 他 例 程 ,并 作 必 要 的 全 局 初 
始 化 。 
设备 加 入 例 程 。 所 有 的 即 插 即 用 设备 都 需要 实现 一 个 设备 加 入 例 程 ,当即 插 即 用 管 
理 器 检测 到 一 个 新 的 硬件 加 入 时 ,会 调用 该 例 程 。 该 例 程 为 新 的 设备 分 配 一 个 新 的 
设备 对 象 。 
调度 例 程 。 设 备 驱动 程序 通过 调度 例 程 来 实现 主要 的 功能 。 例 如 ,设备 ,文件 系统 
和 网 络 设备 实现 的 打开 关闭 . 读 取 和 写 人 等 功能 例 程 。 

1/O 启 始 例 程 。 当 一 个 W/O 请 求 处 理 开始 时 ,I/O 管理 器 通过 该 例 程 来 初始 化 与 设 
备 交换 的 数据 。 

中 断 服务 例 程 。 当 一 个 设备 发 出 中 断 请 求 时 ,系统 的 中 断 调度 器 将 控制 转 到 该 例 
程 。 它 用 来 实现 需要 实时 处 理 的 设备 请 求 , 并 将 剩 下 的 操作 留 给 中 断 服务 延迟 过 程 
调用 例 程 处 理 。 

中 断 服务 延迟 过 程 调用 例 程 。 在 中 断 服务 例 程 返回 调用 程序 后 ,中 断 服务 延迟 过 程 
调用 例 程 有 更 多 的 时 间 处 理 完 1/O 请 求 的 操作 ,以 减少 对 其 他 的 系统 服务 的 影响 。 
终止 例 程 。 在 分 层 设备 驱动 中 需要 实现 这 一 例 程 , 当 低层 的 设备 驱动 完成 处 理 后 ， 
会 调用 该 例 程 来 通知 上 层 设备 驱动 相应 的 处 理 结果 。 

调 出 例 程 。Windows 的 设备 驱动 程序 可 以 动态 地 调 人 和 调 出 , 当 调 出 设备 驱动 程序 
时 ,I/O 管理 器 通过 调用 该 例 程 来 释放 该 驱动 程序 占用 的 系统 资源 ,并 将 驱动 程序 
移出 内 存 。 


11.2.2 Windows 的 I/O 处理 


Windows 应 用 程序 通过 调用 相应 的 子 系统 函数 来 发 出 IO 请 求 ,IO 请 求 通过 LO 管 
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理 器 和 设备 驱动 程序 到 达 实 际 的 物理 设备 。 下 面 我 们 将 在 介绍 不 同类 别 的 VO 请 求 的 基 
础 之 上 ,分析 Windows 处 理 W/O 请 求 的 基本 过 程 。 

1. I/O 处 理 的 类 型 

常见 的 Windows 1/O 处 理 可 以 按照 其 功能 分 为 以 下 几 种 类 型 : 

(1) 同步 I/O 和 异步 1/O: 当 了 驱动 程序 初始 化 1/O 处 理 后 会 马上 返回 1/O 管理 器 ,同步 
LI/O 操作 会 等 待 设备 处 理 完 数据 ,再 返回 到 调用 程序 继续 执行 ;异步 1/O 操作 则 会 马上 返回 
到 调用 程序 ,等 W/O 请 求 处 理 完 后 ,再 进行 数据 同步 。 

(2) 快速 I/O: 为 了 提高 系统 访问 文件 或 高 速 缓存 的 速度 , Windows 还 提供 了 一 种 直 
接 访 问 文件 系统 驱动 和 缓存 管理 器 的 I/O 处 理 机 制 。 这 种 1/O 处 理 避 免 了 发 送 I/O 请 求 
包 而 带 来 的 延 时 ,可 以 提高 访问 的 效率 。 

(3) 映射 文件 LO: 通过 映射 文件 , Windows 可 以 将 磁盘 上 的 文件 当 作 进程 的 虚拟 空 
间 的 一 部 分 。 应 用 可 以 将 文件 当 作 一 个 大 的 数组 来 直接 访问 ,而 内 存 管理 器 通过 映射 文件 
W/O 来 完成 映射 文件 到 磁盘 文件 的 转换 。 在 核心 操作 系统 服务 中 ,映射 文件 WO 被 用 于 高 
速 文件 缓存 和 映像 激活 ( 调 人 可 执行 程序 ) 。 

(4) 集中 式 的 IO: 为 了 提高 文件 访问 效率 , Windows 的 I/O 系统 提供 了 一 种 集中 访 
问 连续 文件 块 的 访问 机 制 。 当 应 用 程序 对 连续 的 文件 块 进行 读 写 时 ,即使 它们 在 进程 的 地 
址 空间 中 不 是 连续 存放 的 ,I/O 系统 也 会 将 几 个 I/O 请 求 合 成 一 个 来 进行 处 理 , 以 便 减 少 磁 
盘 1/O 的 次 数 。 

2. 单 层 驱动 的 MO 处 理 

Windows I/O 系统 通过 1/O 请 求 包 来 表示 一 个 1/O 请 求 , 在 应 用 调用 一 个 I/O 服务 
时 ,I/O 管理 器 会 创建 一 个 I/O 请 求 包 ,并 将 它 保存 在 非 分 页 系统 内 存 空间 中 ,以 便 核心 态 
系统 服务 对 它 进行 访问 。 

通常 一 个 1/O 请 求 是 由 一 层 或 多 层 设 备 驱动 程序 配合 完成 的 。 如 图 11. 2 所 示 ,首先 分 
析 一 个 简单 的 单 层 驱动 处 理 同 步 1/O 请 求 的 过 程 : 

(1) 应 用 调用 I/O 处 理 函 数 , 并 通过 相应 的 子 系统 动态 连接 库 发 出 的 I/O 请 求 ; 

(2) 子 系统 的 动态 连接 库 调用 1/O 管理 器 的 请 求 服务 ; 

(3) I/O 管理 器 分 配 一 个 W/O 请 求 包 来 表示 该 请 求 ,并 将 它 发 送 到 相应 的 设备 驱动 
程序 ; 

(4) 设备 驱动 程序 将 I/O 请 求 包 中 的 数据 发 送 到 相关 的 设备 ,进行 IO 操作 ; 

(5) 在 完成 1/O 处 理 后 ,设备 发 出 中 断 通知 处 理 器 操作 完成 ; 

(6) 处 理 器 的 控制 转 到 驱动 程序 的 结束 服务 来 通知 I/O 管理 器 处 理 完毕 ,并 由 1/O 管 
理 器 将 控制 返回 到 调用 程序 。 

3. 多 层 驱 动 的 MO 处 理 示例 

如 图 11. 3 所 示 ,以 文件 系统 的 磁盘 操作 I/O 为 例 , 分 析 多 层 驱动 处 理 一 个 非 同步 IO 
请 求 的 过 程 。 

当 1/O 管理 器 收 到 一 个 磁盘 操作 I/O 请 求 后 ,为 它 分 配 一 个 IO 请 求 包 并 首先 将 它 发 
送 给 文件 系统 驱动 程序 。 文 件 系统 驱动 程序 再 将 该 请 求 包 转 发 给 磁盘 驱动 。 

与 单 层 驱动 不 同 的 是 ,多 层 驱 动 的 IVO 请 求 包 有 一 组 驱动 栈 信息 ,每 一 层 驱 动 通过 维 
护 相 应 的 驱动 栈 信息 来 完成 自己 的 操作 并 进行 信息 传递 。 
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户 态 核心 态 


| 
子 系统 I IO 设备 驱动 洒 


发 出 VO 请 求 | 


调用 VO 管理 ||| 创建 UVO 请 求 | _| 将 设备 请 求 包 | [二 训 人 有 
器 请 求 服务 站 | 包 ， 并 发 送 到 | | 中 的 相应 数据 "| 完成 相应 
设备 驱动 程序 | | 传送 给 设备 
| 
处 理 中 断 并 返 | 。 | 操作 完毕 并 发 
完成 VO 请 求 ， 让 | 回执 行 状态 “| 
| 
1 1 1 ! 


图 11.2 单 层 驱动 处 理 同步 1/O 请 求 的 过 程 


户 态 ”| ”核心 态 
' 文件 系统 
| 驱动 程序 磁盘 设备 
发 出 VO 请 求 | | 创建 1O 请 求 
填写 第 二 个 驱 
调用 IO 管理 并 调用 文件 动 栈 信息 ， 并 
器 请 求 服务 | 未 统 驱动 程序 调用 磁盘 驱动 [~| 将 WO 请求 
| 程序 包 中 的 数据 =~| 完成 相应 的 
| 发 送 到 磁盘 | | 磁盘 操作 
| 
医 [| 返 加 上- 返回 | 把 
| | 控制 控制 控制 | 
| | 
一 一 一 -+ 了 | 返回 执行 状态 | 返回 执行 状态 |-| 返回 执行 状态 |- | 操作 完 和 
; 1 发 出 中 断 
图 11. 3 ”多 层 驱动 处 理 非 同步 1/O 请 求 的 过 程 


和 同步 W/O 处 理 不 同 ,异步 IO 处 理 将 W/O 请 求 包 传递 到 磁盘 驱动 后 ,磁盘 驱动 在 将 
相关 数据 发 送 到 磁盘 设备 的 同时 立即 将 控制 返回 到 调用 程序 。 等 到 磁盘 设备 完成 操作 后 ， 
再 通过 中 断 将 执行 状态 返回 到 应 用 程序 ,并 作 相关 的 数据 同步 。 


11.3 Windows 的 文件 系统 


在 11. 2 节 中 提 到 , Windows 的 文件 系统 是 以 设备 驱动 的 形式 来 实现 的 。 操 作 系 统 将 


信息 以 文件 的 形式 存储 在 外 存 ( 如 磁盘 ) 上 ,文件 系统 驱动 和 磁盘 驱动 共同 构建 了 Windows 
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的 文件 系统 。 本 节 介 绍 Windows 如 何在 磁盘 管理 的 基础 之 上 ,通过 文件 系统 驱动 来 构建 文 
件 系统 。 


11.3.1 Windows 磁盘 管理 


Windows 将 磁盘 分 为 固定 大 小 的 “ 扇 区 ”, 扇 区 的 大 小 取决 于 不 同 的 存储 设备 。 大 部 分 
便 盘 的 扇 区 大 小 为 512B, 而 CD-ROM 的 扇 区 大 小 一 般 


为 2048B。 | 
相 邻 的 扇 区 集合 组 成 “分 区 ”, Windows 通过 分 区 表 攻心 态 IO 管理 器 

来 存储 每 个 分 区 的 开始 扇 区 、 大 小 和 其 他 相关 的 特性 。 Se 

Windows 通过 “ 卷 ” 来 抽象 一 个 或 几 个 分 区 , 它 是 文件 系 由 二 全 人 ] 一 | 

统 操作 磁盘 的 逻辑 的 单元 。 | 一 一 天极 管 理 | 
如 图 11.4 所 示 , 文 件 系统 是 构建 在 磁盘 管理 之 上 的 。 LK 管理 器 | | 

系统 通过 分 区 管理 器 和 卷 管理 器 与 磁盘 设备 进行 交互 ， 破 盘 设 备 

为 文件 系统 提供 一 个 以 卷 为 单位 的 多 辑 视图 。 文 件 系统 图 11 4。 Windows 感 息 管理 相关 

在 卷 管理 器 的 基础 之 上 构建 文件 系统 的 格式 ,并 为 /0 Mp 


管理 器 提供 操作 文件 的 接口 。 
11.3.2 Windows 文件 系统 格式 


Windows 支持 多 种 文件 系统 格式 ,包括 CDFS、UDF、FAT12、FAT16、FAT32 和 
NTFS。 

1. CDFS 和 UDF 

CDFS(CD-ROM 文件 系统 ) 是 一 个 支持 CD-ROM 文件 的 只 读 文件 系统 ,最 大 支持 的 
文件 大 小 为 4GB, 最 多 支持 65 535 个 目录 。UDF( 通 用 磁盘 格式 文件 系统 ) 主 要 提供 了 对 
DVD 文件 的 支持 。 

2. FAT 

FAT( 文 件 分 配 表 文件 系统 ) 是 一 个 简单 的 文件 系统 , 它 最 初 是 为 DOS 操作 系统 设计 
的 。 它 适用 于 小 容量 的 磁盘 ,文件 目录 也 比较 简单 。 为 了 向 后 兼容 , Windows NT 体系 结构 
的 操作 系统 仍然 支持 FAT 文件 系统 。 

FAT 文 件 系 统 是 根据 其 组 织 形式 (文件 分 配 表 ) 而 命名 的 ,文件 分 配 表 位 于 卷 的 开头 。 
为 了 防止 文件 系统 遭 到 破坏 ,FAT 文 件 系统 保存 了 两 个 文件 分 配 表 , 当 其 中 一 个 遭 到 破坏 
时 ,另外 一 个 可 以 作为 备份 。 而 且 , 文 件 分 配 表 和 根 目录 必须 放 在 磁盘 的 一 个 固定 的 位 置 ， 
这 样 系统 在 启动 时 才 可 以 找到 需要 的 文件 。 

以 FAT 文件 系统 格式 化 的 卷 以 簇 为 单位 进行 分 配 ,FAT 有 3 个 不 同 的 版 本 : FAT12、 
FAT16 和 FAT32,FAT 后 面 的 数字 代表 用 来 表示 簇 号 的 位 数 ,这 个 数字 ,表示 在 一 个 分 区 
上 可 以 存储 的 簇 的 数目 越 大 。 

3. NTFS 

NTFS (NT 文件 系统 ) 是 基于 Windows NT 体系 结构 的 Windows 操作 系统 的 主流 文 
件 系统 ,NTFS 的 每 个 卷 可 以 支持 2” 一 1 个 文件 ,一 个 文件 最 大 可 达到 16TB。 

NTFS 具有 许多 优秀 的 性 能 ,如 文件 和 目录 的 安全 机 制 、 磁 盘 配 额 \ 文 件 压缩 以 及 加 密 
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等 ,而且 当 系统 不 正常 中 止 后 ,文件 系统 可 以 自动 恢复 目录 和 文件 的 结构 信息 。11. 4 节 将 
详细 介绍 NTFS 的 结构 。 


11.3.3 Windows 文件 系统 驱动 


Windows 通过 文件 系统 驱动 来 管理 不 同 格式 的 文件 系统 , 它 运 行 在 核心 态 。 作 为 设备 
管理 的 一 部 分 ,文件 系统 驱动 程序 需要 在 1/O 管理 器 中 注册 。 为 了 提高 文件 操作 的 效率 ， 
文件 系统 驱动 程序 和 内 存 管 理 器 交互 得 非常 密切 。 为 了 提高 吞吐 量 , 它 还 和 高 速 缓存 管理 
器 直接 交互 。 

文件 系统 驱动 程序 在 1/O 管理 器 中 注册 后 ,I/O 管理 器 可 以 通过 它 来 识别 卷 。 每 一 个 
Windows 文件 系统 的 第 一 个 扇 区 都 被 预 留 为 卷 的 根 扇 区 ,通过 根 扇 区 ,文件 系统 驱动 程序 
可 以 找到 相应 的 文件 系统 所 需要 的 数据 信息 。 

当 文件 系统 驱动 识别 了 一 个 卷 后 , 它 会 创建 一 个 设备 对 象 来 表示 文件 系统 。 相 应 的 存 
储 设备 管理 器 也 创建 一 个 设备 对 象 来 表示 具体 的 存储 设备 。 通 过 这 两 个 设备 对 象 ,IO 管 
理 器 将 传递 到 卷 设备 管理 器 的 I/O 请 求 转发 到 存储 管理 器 的 设备 对 象 。 

应 用 可 以 通过 两 种 方式 来 访问 文件 ,一 种 是 直接 通过 文件 访问 函数 进行 文件 操作 ,如 
ReadFile 和 WriteFile 等 , 它 通 过 磁盘 驱动 的 I/O 处 理 来 操作 磁盘 。 另 外 一 种 是 通过 读 写 
映射 文件 的 地 址 空间 来 完成 文件 操作 , 它 通过 映射 文件 来 操作 磁盘 。 


11.4 NTFS 文件 系统 


作为 Windows 主流 的 文件 系统 ,NTFS 可 以 满足 企业 级 应 用 的 需要 。 例 如 ,在 系统 掉 
电 或 系统 崩溃 时 ,NTEFS 可 以 保证 数据 的 一 致 性 ;NTFS 具有 统一 的 安全 机 制 , 保 证 敏感 的 
数据 不 被 非法 访问 ;NTFS 提供 了 低 成 本 的 软件 数据 元 余 以 保护 用 户 数 据 等 。 


11.4.1 NTFS 的 特点 


NTFS 具有 以 下 特点 。 

(1) 可 恢复 性 。NTEFS 利用 事务 来 实现 文件 系统 的 可 恢复 ,操作 系统 将 一 系列 对 文件 
系统 结构 修改 的 操作 组 成 事务 。 事 务 不 间断 地 执行 完 后 可 以 保证 文件 系统 的 一 致 性 ,如 果 
事务 在 没有 执行 完 之 前 被 中 断 , 已 执行 的 操作 必须 进行 回 退 ,以 保证 文件 系统 结构 恢复 到 事 
务 操作 之 前 。 

(2) 安全 性 。NTFS 的 安全 性 是 通过 Windows 的 对 象 模型 来 实现 的 ,每 一 个 打开 的 文 
件 都 由 一 个 文件 对 象 来 表示 ,文件 对 象 的 安全 描述 作为 文件 的 一 部 分 存储 在 磁盘 上 。 在 一 
个 进程 打开 一 个 文件 对 象 的 句柄 时 , Windows 的 安全 系统 服务 会 验证 该 进程 是 否 有 访问 该 
对 象 的 授权 。 

(3) 元 余 与 容错 。 数 据 的 可 恢复 性 可 以 保证 文件 系统 在 磁盘 上 可 以 访问 ,但 不 能 保证 
恢复 所 有 的 用 户 文件 。NTFS 通过 元 余 来 保护 关键 的 文件 系统 信息 , 当 存 储 该 信息 的 磁盘 
局 区 损坏 时 ,系统 可 以 利用 宛 余 扇 区 来 恢复 文件 数据 。 

(4) 动态 坏 簇 重 映像 。 当 系统 试图 读 一 个 被 损坏 的 扇 区 时 ,Windows 容错 驱动 程序 会 
自动 搜索 到 备份 扇 区 。 同 时 ,NTFS 会 重新 分 配 一 个 扇 区 ,作为 该 扇 区 新 的 备份 。 
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(5) 基于 统一 字符 编码 (Unicode) 的 命名 机 制 。NTFS 用 统一 字符 编码 来 存储 文件 名 、 
目录 名 和 卷 名 , 16 位 的 字符 编码 可 以 让 不 同 国家 的 用 户 用 自己 的 语言 来 命名 ,使 得 
Windows 的 国际 化 版 本 很 容易 实现 。 

(6) 文件 压缩 。NTEFS 支持 文件 压缩 功能 ,并 透明 地 管理 压缩 和 解压 的 过 程 。 用 户 还 
可 以 选择 将 一 个 文件 目录 压缩 ,系统 会 将 该 目录 下 的 所 有 文件 压缩 。 

(7) 加 密 。NTEFS 的 安全 性 并 不 能 保护 计算 机 丢失 或 文件 被 泄露 后 的 数据 私密 性 ， 
NTFS 通过 加 密 文件 系统 来 实现 敏感 数据 的 加 密 保 护 。 


11.4.2 NTFS 的 磁盘 结构 


下 面 介 绍 NTFS 如 何 划分 磁盘 空间 ,以 及 如 何 组 织 文 件 和 目录 。 

ls 鞠 

系统 格式 化 磁盘 时 ,首先 将 磁盘 分 割 成 一 个 或 多 个 卷 。 卷 代表 着 磁盘 的 一 个 逻辑 分 区 ， 

一 个 卷 包含 一 系列 的 文件 和 可 被 利用 的 磁盘 空间 。 

2. 簇 

簇 是 在 一 个 卷 上 的 固定 大 小 的 磁盘 空间 , 艇 的 大 小 在 系统 格式 化 时 就 确定 了 。 簇 的 大 
小 和 卷 的 大 小 相关 , 它 一 般 是 物理 扇 区 大 小 的 偶数 倍 。NTFS 基于 秘 而 不 是 扇 区 来 操作 ,是 
为 了 使 文件 系统 独立 于 不 同 大 小 的 物理 扇 区 。NTFS 可 以 通过 设置 较 大 的 复 空 间 来 支持 大 
容量 的 磁盘 ,或 者 通过 得 大 小 的 调整 来 支持 非 标准 物理 扇 区 的 磁盘 。 当 磁盘 分 区 很 大 时 ,还 
可 以 通过 设置 较 大 的 簇 空间 来 减少 磁盘 碎片 和 磁盘 定位 的 时 间 。 

为 了 定位 相关 的 徐 在 磁盘 上 的 物理 位 置 , NTFS 引入 了 人 逻 辑 艇 号 (logical cluster 
number) 。 迪 辑 徐 号 表示 从 卷 的 开始 到 结束 的 顺序 编号 ,将 相应 的 敢 辑 秘 号 乘 以 簇 大 小 就 
得 到 了 该 轴 辑 簇 号 在 物理 盘 上 的 位 置 。NTFS 通过 虚拟 艇 号 (virtual cluster number) 来 定 
位 一 个 文件 中 数据 的 位 置 ,虚拟 簇 号 将 文件 从 开始 到 结尾 顺序 编号 。 每 个 虚拟 簇 号 都 映射 
到 一 个 迎 辑 复 号 ,因此 连续 的 虚拟 簇 号 在 物理 上 不 一 定 是 连续 存放 的 。 

3. 文件 

NTFS 的 一 个 特点 就 是 存储 在 卷 上 的 所 有 数据 都 保存 在 文件 中 ,包括 用 于 定位 和 查找 
文件 的 文件 系统 的 结构 数据 。 当 磁盘 的 一 部 分 损坏 后 ,NTFS 可 以 重 定 位 这 些 文件 ,使 得 磁 
盘 可 以 继续 使 用 。NTFS 中 ,包含 目录 在 内 的 文件 名 的 长 度 可 达 255B, 可 以 包含 Unicode 
字符 、 空 格 和 句点 。 

主 控 文件 表 是 NTFS 卷 结构 的 核心 , 它 由 一 组 文件 记录 构成 。 不 管 徐 的 大 小 如 何 , 每 
个 文件 记录 的 大 小 固定 为 1KB, 每 一 个 文件 在 主 控 文件 表 上 都 有 一 个 文件 记录 与 之 对 应 。 
除了 数据 文件 之 外 ,NTFS 的 卷 还 包含 了 用 来 实现 文件 系统 的 结构 文件 , 主 控 文件 表 本 身 也 
以 文件 的 形式 存在 。 为 了 区 别 于 用 户 文件 ,这 些 系 统 结构 文件 用 $ 标志 符 作 为 文件 名 的 首 
字符 ,如 主 控 文件 表 的 文件 名 为 $ MFT。 

每 个 文件 都 通过 一 个 文件 记录 来 描述 ,文件 记录 用 不 同 的 属性 来 描述 文件 的 文件 名 、 时 
间 信 息 和 其 他 文件 说 明 信 息 ,文件 数据 也 可 以 看 作 是 文件 记录 的 一 个 属性 。 

当 文 件 的 所 有 属性 (包括 数据 属性 ) 占 用 的 空间 小 于 1KB 的 文件 记录 时 ,所 有 的 数据 可 
以 直接 存储 在 文件 记录 中 。 如 图 11. 5 所 示 , 当 文件 的 大 小 超过 1KB 时 ,NTFS 会 分 配额 外 
的 盘 区 来 存储 文件 的 数据 ,并 通过 文件 记录 的 数据 属性 指向 了 额外 分 配 的 盘 区 。 
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文件 记录 | 标准 信息 | 文件 名 数据 


人 F 


图 11.5 大 于 1KB 的 文件 存储 结构 


4. 目录 

在 NTFS 文件 系统 中 ,文件 目录 的 结构 为 该 目录 所 有 文件 名 的 索引 记录 , 它 也 存放 在 
主 控 文件 表 中 。 在 创建 一 个 文件 目录 时 ,NTFS 会 根据 该 目录 下 的 文件 的 名 称 属性 建立 索 
引 。 以 一 个 卷 的 根 目录 为 例 , 其 文件 名 索引 记录 如 图 11.6 所 示 。 


Rn 索引 根 
标准 信息 | | 文件 4 | 文件 10 | 文件 15 
文件 索引 记录 | 
1 1 
文件 0 | 文件 1 | 文件 3 | 文件 | 文件 12 [文件 13| 文件 14 
索引 缓冲 区 
| 文 作 6 | 文件 8 | |[ 文 作 9 


图 11.6 Windows 的 根 目 录 存储 结构 示例 


一 个 目录 的 主 控 文 件 记录 将 其 目录 中 的 文件 名 和 子 目录 名 进行 排序 ,并 保存 在 索引 根 
属性 中 。 对 于 一 个 大 的 目录 ,系统 用 一 个 固定 为 4KB 大 小 的 索引 缓冲 区 来 存储 不 能 放 在 索 
引 记 录 中 的 文件 名 。NTFS 用 B 十 树 来 实现 索引 管理 ,用 B 十 树 来 存储 文件 名 有 很 多 好 处 ， 
由 于 文件 名 是 排序 后 存放 的 ,所 以 目录 查找 起 来 非常 快 。 而 且 ,B 十 树 趋向 于 横向 增长 , 因 
此 当 文 件 目录 不 断 加 深 时 ,NTFS 的 查找 效率 不 会 降低 。 


11.4.3 NTFS 的 文件 系统 恢复 


NTFS 利用 恢复 机 制 保证 当 系统 掉 电 和 出 现 错误 时 ,所 有 的 文件 系统 操作 事务 都 可 以 
执行 完毕 ,从 而 保证 了 磁盘 卷 的 完整 性 。 

在 前 面 讲 到 ,NTFS 是 使 用 事务 处 理 来 实现 恢复 机 制 的 。 恢 复 操作 仅 限 于 文件 系统 的 
数据 ,以 在 确保 卷 的 完整 性 的 同时 ,使 得 恢复 过 程 很 快 。 对 用 户 文件 来 说 ,应 用 程序 需要 定 
义 相应 的 恢复 机 制 来 确保 文件 的 完整 性 。 

日 志 技术 在 恢复 机 制 中 起 到 关键 的 作用 ,NTFS 在 执行 任何 改变 文件 系统 数据 结构 的 
操作 之 前 都 要 将 该 操作 记 入 一 个 日 志文 件 中 。 当 系统 崩溃 后 ,重启 后 的 系统 可 以 根据 日 志 
文件 继续 完成 一 个 事务 中 还 没有 执行 的 操作 ,或 者 取消 一 个 事务 中 已 经 完成 的 操作 。 

日 志 中 的 日 志 记录 通常 有 两 种 : 一 种 是 更 新 记录 ,说 明了 某 一 操作 在 更 新 了 文件 系统 
结构 数据 后 ,继续 执行 或 取消 执行 该 操作 所 在 的 事务 的 方法 。 另 一 种 是 断 点 记录 ,NTFS 会 
定时 在 日 志文 件 中 写 入 这 种 记录 ,说 明 当 系 统 在 断 点 处 衣 溃 时 需要 执行 的 恢复 操作 。 
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本 章 小 结 


本 章 介 绍 了 Windows 操作 系统 的 设备 管理 机 制 , 以 及 作为 其 重要 组 成 部 分 的 磁盘 管理 
和 文件 系统 。 

首先 ,从 计算 机 外 设 管理 输入 /输出 的 角度 介绍 了 Windows 设备 管理 的 设计 目标 。 然 
后 详细 介绍 了 构成 Windows 1/O 系统 的 各 功能 模块 以 及 它们 之 间 的 关系 。1O 管理 器 是 
Windows 1/O 系统 的 核心 , 它 一 方面 为 应 用 程序 提供 操作 设备 的 接口 , 另 一 方面 为 设备 驱 
动 程序 提供 了 支撑 环境 。 

设备 驱动 程序 直接 和 硬件 设备 进行 交互 ,为 I/O 管理 器 访问 硬件 提供 了 逻辑 接口 。 本 
章 介绍 了 常见 的 设备 驱动 程序 的 类 型 和 基本 结构 。 文 件 系 统 也 是 设备 驱动 程序 的 一 种 , 它 
通过 磁盘 驱动 管理 物理 磁盘 上 的 数据 。 大 部 分 Windows 的 设备 驱动 程序 都 支持 即 插 即 用 
功能 ,使 得 1/O 系统 能 方便 地 管理 各 种 外 接 设备 。 还 有 一 类 设备 驱动 程序 不 直接 和 硬件 设 
备 打交道 ,它们 为 运行 在 用 户 态 的 应 用 访问 系统 内 核 和 驱动 程序 提供 接口 。 

在 介绍 了 设备 驱动 程序 的 结构 之 后 ,本 章 还 介绍 了 Windows 设备 管理 系统 处 理 一 个 1/ 
O 请 求 的 过 程 。I/O 请 求 由 用 户 程 序 调用 相应 的 I/O 函数 开始 ,通过 I/O 请 求 包 将 请 求 从 
WO 管理 器 传递 到 相应 的 设备 驱动 程序 。I/O 请 求 的 处 理 可 能 由 一 个 设备 驱动 程序 完成 ， 
也 可 能 是 由 多 个 分 层 的 设备 驱动 程序 一 起 配合 完成 。 一 般 来 讲 , 设 备 驱动 程序 在 完成 数据 
向 硬件 设备 的 传送 之 后 ,就 将 控制 返回 到 I/O 管理 器 。 在 同步 1/O 处 理 中 ,1/O 管理 器 会 等 
待 硬件 设备 处 理 完 请 求 后 再 返回 调用 程序 ;而 异步 I/O 处 理会 马上 将 控制 返回 到 调用 程 
序 ,等 硬件 设备 处 理 完 请 求 后 再 做 数据 同步 。 

在 介绍 了 通用 的 设备 管理 和 1/O 请 求 处 理 后 ,本 章 又 介绍 了 Windows 的 磁盘 管理 和 文 
件 系 统 。 磁 盘 管 理 是 文件 系统 的 基础 , Windows 将 磁盘 分 为 固定 大 小 的 扇 区 ,又 将 相 邻 的 
扇 区 组 合成 分 区 ,最 后 用 卷 来 抽象 分 区 数据 ,作为 文件 系统 操作 磁盘 的 逻辑 单元 。Windows 
的 分 区 管理 和 卷 管理 统称 为 磁盘 管理 , 它 为 Windows 构建 文件 系统 提供 了 一 个 基础 。 
Windows 支持 多 种 文件 格式 ,包括 支持 CD-ROM 和 DVD 的 文件 格式 ,以 及 从 DOS 操作 系 
统 继承 的 FAT 文件 格式 ,但 主流 的 文件 格式 是 NTFS。 

本 章 详 细 介 绍 了 NTFS 文件 格式 的 特点 、 磁 盘 管 理 、 构 成 文件 和 目录 的 方式 ,以 及 如 何 
实现 文件 系统 的 自动 恢复 。NTFS 在 设计 上 可 以 满足 企业 级 用 户 的 需要 ,在 支持 大 容量 的 
文件 格式 的 同时 ,还 考虑 到 文件 系统 的 安全 性 .可 恢复 性 .数据 的 宛 余 保 护 以 及 文件 的 加 密 。 
NTFS 通过 可 变 大 小 的 簇 来 操作 磁盘 , 比 用 扇 区 操作 更 加 灵活 。 

文件 和 目录 是 文件 系统 的 基本 表现 形式 ,本 章 介 绍 了 NTFS 如 何 构建 文件 和 目录 。 
NTFS 文件 系统 的 所 有 数据 都 被 保存 在 文件 中 ,包括 文件 系统 格式 的 格式 数据 。Windows 
通过 主 控 文 件 表 来 表示 文件 和 目录 的 组 织 方式 ,每 个 文件 和 目录 都 是 主 控 文 件 表 中 的 一 个 
记录 ,每 个 文件 记录 的 大 小 固定 为 1KB。 文 件 记 录 由 若干 属性 组 成 ,文件 数据 也 是 其 中 的 
一 个 属性 。 当 文件 的 所 有 属性 占用 的 空间 小 于 1KB 时 ,可 以 用 一 个 文件 记录 表示 该 文件 ; 
当 文 件 大 于 1KB 时 ,NTFS 会 分 配额 外 的 盘 区 来 储存 文件 数据 。NTFS 的 目录 是 该 目录 下 
所 有 文件 的 文件 名 和 子 目 录 名 的 索引 ,索引 记录 也 被 保存 在 主 控 文 件 表 中 。 一 个 目录 下 的 
文件 名 和 子 目 录 名 被 保存 在 索引 记录 的 根 属性 中 ,如 果 目 录 属 性 超过 1IKB, 系 统 会 分 配 索 
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引 缓冲 区 来 存放 这 些 索引 。NTEFS 用 B 十 树 的 结构 来 管理 这 些 索引 ,以 提高 目录 操作 的 
最 后 ,本 章 还 介绍 了 NTFS 利用 事务 机 制 来 实现 文件 系统 自动 恢复 的 方法 。 


习题 
11.1 Windows 的 设备 管理 系统 由 哪 几 部 分 构成 ? 它们 之 间 的 关系 如 何 ? 
11.2 试 述 1/O 管理 器 的 功能 , 它 如 何 将 I/O 请 求 传递 到 设备 驱动 程序 ? 
11.3 描述 Windows 设备 驱动 程序 的 构成 以 及 其 中 各 个 例 程 的 功能 。 


1 
2 
3 
4 ”同步 1/O 处 理 过 程 和 异步 1/O 处 理 过 程 的 主要 区 别 是 什么 ? 
11.5 Windows 的 磁盘 管理 由 哪 几 部 分 构成 ?它们 如 何 管理 磁盘 ? 
6 ”分析 一 个 安装 了 Windows 操作 系统 的 计算 机 的 文件 目录 结构 。 
7 为 什么 NTFS 用 禾 而 不 是 扇 区 来 操作 磁盘 ? 它 的 优点 是 什么 ? 
8 描述 一 个 NTFS 文件 的 主 控 表 文件 记录 的 格式 ,并 画 出 它 的 结构 图 。 
9 撒 述 一 个 大 目录 结构 的 主 控 文 件 表 文 件 索 引 记录 格式 ,并 画 出 它 的 结构 图 。 
11.10 NTFS 的 日 志 中 记录 了 哪 几 种 操作 ? 它们 的 功能 是 什么 ? 
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第 12 章 嵌入 式 操 作 系 统 简介 


艇 入 式 操作 系统 (Embedded Operating System,EOS) 是 一 种 支持 艇 入 式 系统 应 用 的 实 
时 操作 系统 ,是 租 入 式 系统 极为 重要 的 组 成 部 分 。 本 章 以 VxWorks 敌人 式 实时 操作 系统 
为 例 来 介绍 内 入 式 操作 系统 的 进程 管理 .调度 .内存 管 理 . 设 备 管理 和 文件 系统 的 基本 原理 ， 
并 介绍 如 何 进行 嵌入 式 操作 系统 的 开发 。 


12.1 谱 入 式 操作 系统 的 总 体 架 构 


嵌入 式 操作 系统 又 称 实时 操作 系统 (Real Time Operation System,RTOS) ,是 运行 在 
对 和 人 式 硬 件 平台 上 ,对 系统 软 硬 件 资源 进 行 统一 协调 控制 的 操作 系统 软件 ,通常 包括 与 硬件 
相关 的 底层 驱动 软件 系统 内 核 `. 设备 驱 动 接口 .通信 协议 .图 形 界 面 和 标准 化 浏览 器 


Browser 等 。 


12.1.1 藤 入 式 操作 系统 特点 及 分 类 


1. 矢 入 式 操作 系统 的 特点 

目前 存在 很 多 种 租 入 式 操作 系统 ,如 VxWorks、nC/OS. 幅 入 式 Linux 和 WinCE 等 ,这 
些 操 作 系 统 功能 日 益 完善 ,在 咎 入 式 系统 中 能 实现 很 多 桌面 通用 操作 系统 具备 的 功能 。 髓 
入 式 操作 系统 除了 有 具有 通用 操作 系统 的 基本 特点 之 外 ,更 有 其 特殊 的 部 分 ,如 高 实时 性 、 可 


裁 前 性、 高 可 靠 性 ,接口 统一 、 网 络 功能 强大 、 体 积 小 巧 、 固 化 代码 ,操作 简单 易学 等 特点 ,其 
中 重要 的 包括 高 实时 性 、 可 裁剪 性 和 高 可 靠 性 等 。 

1) 高 实时 性 

大 多 数 般 入 式 操作 系统 工作 在 对 实时 性 要 求 很 高 的 场合 ,如 监测 控制 ,数据 采集 和 信息 
处 理 等 。 这 些 过 程 往往 是 一 个 连续 的 过 程 ,一 个 过 程 必须 在 一 个 定 长 的 时 间 内 完成 ,否则 若 
惕 辑 和 时 序 出 现 偏差 ,将 会 引起 严重 后 果 。 因 此 , 艇 入 式 操作 系统 中 实时 性 是 其 重要 特征 
之 一 。 
2) 可 裁剪 性 
由 于 骨 入 式 系统 是 面向 单一 设备 的 单一 应 用 ,其 环境 复杂 多 变 , 如 硬件 环境 中 除 CPU 
之 外 ,其 他 硬件 并 没有 标准 化 ,而 系统 的 应 用 对 功能 .可 靠 性 成本、 体积 和 功 耗 等 有 一 定 需 
求 。 因 此 ,嵌入 式 操 作 系 统 必 须 是 开放 的 .可 伸缩 的 体系 结构 ,其 中 的 很 多 部 件 必 须 具 有 很 
强 的 可 裁剪 性 ,便于 修改 ,从 而 能 适应 不 同 垦 入 式 系统 的 需求 。 

3) 高 可 靠 性 

高 可 靠 性 是 嵌入 式 系统 的 基本 特征 之 一 ,嵌入 式 系统 中 ,出 于 安全 方面 的 考虑 ,要 求 系 
统 不 能 崩 演 ,而 且 还 要 有 自 愈 能力。 因此 ,作为 丛 入 式 系 统 的 最 基本 软件 的 操作 系统 ,需要 
尽 可 能 减少 安全 漏洞 和 不 可 靠 的 隐患 ,通过 系统 监控 进程 监视 各 进程 的 运行 状况 ,在 遇 到 异 
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常情 况 时 采取 措施 对 其 进行 修复 ,实施 有 利于 系统 稳定 可 靠 的 方法 将 问题 解决 ,从 而 从 嵌入 
式 系统 的 底层 增强 可 靠 性 。 

4) 统一 的 接口 

骨 入 式 操作 系统 可 提供 各 种 设备 的 驱动 接口 。 随 着 各 类 艇 入 式 操 作 系统 的 开发 ,考虑 
到 为 内 入 式 应 用 软件 的 设计 者 提供 统一 的 服务 接口 ,就 必须 约定 能 入 式 系 统 提 供 的 接口 ,从 
而 为 姐 入 式 应 用 软件 的 运行 提供 无 关 性 平台 。 

5) 网 络 功 能 强大 

柑 入 式 操作 系统 必须 不 仅 能 支持 TCP/IP 协议 ,还 能 支持 其 他 如 UDP/PPP 协议 等 ,并 
为 嵌入 式 系 统 提供 统一 的 MAC 访问 层 接口 ,从 而 为 各 种 移动 计算 设备 预 留 接 口 ,提供 对 更 
多 的 能 入 式 系统 的 支持 。 

2. 骨 入 式 操作 系统 的 分 类 

当前 ,常用 的 嵌入 式 操作 系统 可 分 为 商用 系统 .专用 系统 以 及 开放 系统 三 大 类 。 

1) 商用 做 入 式 操 作 系 统 

商用 人 能 入 式 操作 系统 功能 较 强 大 ,辅助 工具 较 齐 全 ,可 应 用 的 范围 也 较 广 , 在 许多 领域 
都 有 应 用 ,例如 Microsoft 的 Windows CE、WindRiver 的 VxWorks、EPSON 的 ROS33、 
CoreTek 的 DeltaOS、pSOS 十 ,3Com 的 PalmOS 以 及 中 科 院 的 Hopen 等 。 

2) 专用 衣 人 式 操 作 系 统 

专用 嵌入 式 操 作 系 统一 般 不 对 用 户 公 开 , 它 是 一 些 专业 的 公司 针对 该 公司 产品 所 特制 
的 垦 入 式 操作 系统 。 专 用 内 入 式 操作 系统 功能 相对 较 弱 ,但 具有 较 强 的 针对 性 ,而 且 比 普通 
的 商用 笛 入 式 操作 系统 更 加 安全 可 靠 。 

3) 开放 嵌 人 式 操作 系统 

开放 艇 入 式 操 作 系统 是 近年 来 迅速 发 展 的 一 类 操作 系统 。 因 为 应 用 系统 的 开发 者 可 免 
费 得 到 这 些 系统 的 源 代码 ,因此 开发 难度 低 。 但 开放 艇 入 式 操 作 系 统 的 功能 简单 ,技术 支持 
以 及 系统 的 稳定 性 也 相对 较 差 , 因 此 对 应 用 系统 开发 者 提出 了 较 高 的 要 求 。 


12.1.2 藤 入 式 操作 系统 的 总 体 架 构 


伐 入 式 操作 系统 通常 包括 与 硬件 相关 的 底层 驱动 软件 .系统 内 核 `. 设 备 驱动 接口 .通信 
协议 .图 形 界面 和 标准 化 浏览 器 Browser 等 。 随 着 宜人 入 式 系统 的 发 展 , 租 入 式 操作 系统 的 体 
系 结构 出 现 了 单 块 结构 分 层 结 构 、 微 内 核 结构 和 构件 化 结构 等 多 种 。 

1. 单 块 结构 

单 块 结构 是 最 早出 现 的 一 种 结构 ,该 结构 将 整个 嵌入 式 实时 操作 系统 看 成 一 个 整 块 , 内 
部 分 为 若干 个 模块 ,模块 之 间 直 接 相 互 调用 ,不 分 层次 ,形成 网 状 调用 模式 ,如 图 12. 1 所 示 。 

由 于 单 块 结构 本 身 具 有 强大 功能 的 完整 内 核 , 能 为 戏 入 式 软件 开发 提供 非常 完整 的 平 
台 , 因 此 ,其 具有 以 下 特点 : 

(1) 可 设置 嵌入 式 芯片 的 通用 接口 。 

(2) 人 允许 设备 驱动 器 .网 络 服务 器 .防火 墙 等 复 用 一 些 公 共 的 代码 或 其 他 开源 代码 。 

(3) 根据 功能 进行 系统 的 开发 ,避免 实现 多 余 功 能 以 及 额外 的 内 存 占用 。 

(4) 用 户 运行 的 应 用 程序 设计 简洁 、 开 发 简单 .易于 调试 .相对 可 靠 。 

(5) 大 多 数 舱 入 式 系 统 对 实时 性 要 求 不 高 , 单 块 结构 可 以 实现 快速 响应 。 
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图 12.1 能 入 式 操 作 系 统 的 单 块 结构 


(6) 通过 硬件 的 设计 保证 对 请 求 的 快速 响应 。 

(7) 对 简单 的 小 系统 , 单 块 结 构 有 几乎 最 高 的 系统 效率 和 实时 性 保障 。 

(8) 通用 RTOS 系统 的 单位 成 本 更 低 。 

(9) 对 于 复杂 系统 的 应 用 , 需 大 量 硬 件 资源 。 

(10) 内 核 的 复杂 性 使 系统 的 运行 变 得 不 可 预测 和 不 可 靠 。 

(11) 模块 越 多 ,模块 之 间 的 依赖 越 严重 ,在 可 裁剪 性 、 可 扩展 性 、 可 移植 性 和 可 维护 性 
等 方面 存在 明显 缺陷 ,制约 了 该 类 结构 RTOS 的 应 用 。 

单 块 结构 常 应 用 在 Windows CE 和 嵌入 式 系统 中 。 

2. 分 层 结构 

分 层 结 构 是 现今 许多 流行 的 租 入 式 实时 操作 系统 所 采用 的 体系 结构 ,在 分 层 结 构 中 ,每 
一 层 对 其 上 层 好 像 一 个 虚拟 计算 机 ,下 层 为 上 层 提 供 服务 ,上 层 使 用 下 层 提供 的 服务 ;在 层 
与 层 之 间 定义 良好 的 接口 ,上 下 层 通 过 结构 进行 交互 和 通信 ;每 一 层 中 划分 为 一 个 或 多 个 模 
块 (组 件 ), 并 可 针对 应 用 需求 配置 个 性 化 RTOS。 整 个 分 层 结构 如 图 12. 2 所 示 。 

分 层 结 构 的 实时 多 任务 内 核 部 分 是 整个 分 层 结构 的 核心 ,其 基本 工作 是 任务 切换 ,其 运 
行 与 队列 密 不 可 分 ;分 层 结构 中 的 其 他 部 分 是 对 整个 嵌入 式 操作 系统 的 有 力 支 撑 , 包 括 存储 
管理 .1/O 设备 管理 (包括 逻辑 I/O 和 设备 驱动 ) 、 租 入 式 文件 系统 、 网 络 系统 和 命令 解释 


器 等 。 
分 层 结构 常用 于 VxWorks .DeltaOS 等 租 入 式 操 作 系 统 中 。 
3. 微 内 核 结构 


微 内 核 结构 是 目前 的 主流 结构 之 一 ,又 称 为 客户 /服务 器 (C/S) 结 构 , 在 这 种 体系 结构 
中 , 微 内 核 仅 提供 任务 调度 ,任务 间 通 信 、 底 层 网 络 通信 、 中 断 处 理 接口 和 实时 时 钟 等 几 种 基 
本 服务 , 且 内 核 非 常 小 ,任务 在 独立 的 地 址 空间 运行 ,速度 极 快 ;而 传统 的 操作 系统 提供 的 其 
他 服务 ,如 存储 管理 .文件 管理 .中 断 处 理 和 网 络 通信 协议 等 ,在 内 核 以 上 以 协作 任务 的 形式 
出 现 , 每 个 协作 任务 可 以 看 成 一 个 功能 服务 器 。 微 内 核 结构 如 图 12. 3 所 示 。 

由 于 微 内 核 结构 中 将 内 核 功 能 和 其 他 服务 功能 分 开 ,因此 , 微 内 核 结构 具有 以 下 优点 和 
不 足 : 

(1) 微 内 核 结 构 中 ,其 他 服务 模块 可 任意 裁剪 ,符合 藤 入 式 操作 系统 的 发 展 要 求 。 
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图 12.2 肉 人 式 操作 系统 的 分 层 结构 图 12.3 嵌入 式 操作 系统 的 微 内 核 结构 


(2) 可 以 更 方便 地 扩展 功能 ,包括 动态 扩展 。 

(3) 可 以 更 容易 地 做 到 上 层 应 用 与 下 层 系统 的 分 离 ,便于 系统 移植 。 

(4) 服务 模块 的 可 重用 性 高 。 

(5) 在 任务 执行 时 ,需要 客户 端 与 服务 器 端 通信 ,会 增加 一 定 的 开销 ,与 整体 系统 相 比 
性 能 将 有 一 定 的 下 降 。 

微 内 核 结 构 常 用 于 QNX 等 通 入 式 操 作 系 统 中 。 

4. 构件 化 结构 

构件 化 结构 是 采用 构件 组 装 思想 及 技术 而 设计 的 体系 结构 ,在 构件 化 结构 中 , 租 入 式 操 
作 系 统 的 内 核 由 一 组 独立 的 构件 和 一 个 构件 管理 器 组 成 ,构件 管理 器 用 于 维护 内 核 构 件 之 
间 的 协作 关系 。 构 件 化 结构 如 图 12.4 所 示 。 


实时 多 任务 应 用 程序 


RTOS 编 程 接口 


构建 运行 管理 器 


设备 驱动 层 
硬件 层 


图 12.4 肉 入 式 操作 系统 的 构件 化 结构 


构件 化 结构 具有 以 下 特点 : 
(1) 所 有 内 入 式 操作 系统 抽象 都 由 可 加 载 的 构件 实现 ,配置 灵活 ,裁剪 方便 。 
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(2) 构件 之 间 具 有 统一 标准 的 交互 式 界面 ,便于 用 户 掌握 ,方便 应 用 程序 开发 。 

(3) 传统 服务 作为 一 个 构件 或 由 一 些 相互 协作 的 构件 构成 ,可 为 应 用 软件 开发 提供 统 
一 的 编程 接口 。 

(4) 通过 构件 组 装 检验 ,可 以 确保 生成 的 嵌入 式 操 作 系 统 满足 设计 约束 。 

(5) 可 以 提供 硬件 无 关 性 支持 。 

构件 化 结构 应 用 在 TinyOS 等 租 入 式 操作 系统 中 。 

总 而 言 之 ,上 述 的 体系 结构 都 是 目前 较为 流行 的 结构 ,从 中 充分 体现 了 舱 入 式 操 作 系统 
的 高 实时 性 、 高 可 靠 性 和 可 裁剪 性 等 特点 。 


12.2 嵌入 式 操作 系统 的 任务 管理 


在 所 有 的 对 人 式 操作 系统 中 ,其 中 重要 的 不 可 或 缺 的 部 分 就 是 任务 管理 。 实 时 多 任务 
管理 是 舱 入 式 实时 操作 系统 的 核心 和 灵魂 ,决定 了 操作 系统 的 实时 性 能 。 它 通常 包含 优先 
级 设置 ,多 任务 调度 机 制 和 时 间 确 定性 等 部 分 。 


12.2.1 多 任务 机 制 


1. 任务 

任务 (task) 是 租 入 式 操作 系统 中 最 重要 的 操作 对 象 , 它 是 指 拥 有 所 有 CPU 资源 的 简单 
程序 。 在 进行 实时 应 用 设计 时 ,嵌入 式 操作 系统 通常 将 工作 分 割 成 多 个 任务 ,每 个 任务 处 理 
一 部 分 问题 ,并 被 赋予 一 定 的 优先 级 、 一 套 自己 的 CPU 寄存 器 及 堆栈 。 

随 着 应 用 的 复杂 化 ,一 个 能 入 式 系统 可 能 要 同时 控制 /监视 多 个 外 设 ,要 求 有 实时 响应 ， 
有 很 多 处 理 任务 ,各 个 任务 之 间 有 多 种 信息 传递 ,因此 ,在 舱 入 式 操 作 系 统 中 ,对 应 用 需求 需 
要 采用 多 任务 处 理 机 制 ,以 分 时 方式 运行 多 个 任务 ,并 对 其 进行 任务 管理 。 

任务 根据 对 截止 时 间 的 要 求 可 以 分 为 硬 实时 任务 和 软 实时 任务 。 硬 实时 任务 是 指 需要 
得 到 及 时 执行 的 任务 ,如 果 在 规定 的 截止 时 间 内 未 满足 ,就 会 出 现 严重 后 果 ; 软 实时 任务 是 
指 那些 在 规定 截止 时 间 内 未 满足 不 会 出 现 严 重 后 果 的 实时 性 任务 。 在 目前 实际 运用 的 能 入 
式 系统 中 ,通常 允许 软 硬 两 种 实时 性 任务 同时 存在 ,其 中 一 些 任 务 没有 时 限 要 求 , 另 外 一 些 
任务 的 时 限 要 求 是 软 实时 的 ,而 对 系统 产生 关键 影响 的 那些 事件 的 时 限 要 求 则 是 硬 实时 的 。 

任务 也 可 以 根据 执行 是 否 呈 现 周 期 性 来 划分 ,可 分 为 周期 性 任务 和 非 周期 性 任务 。 周 
期 性 任务 每 隔 一 个 固定 的 时 间 间 隔 就 会 执行 一 次 , 非 周 期 性 任务 执行 的 间隔 时 间 则 为 不 确 
定 的 。 

2. 任务 控制 块 

任务 控制 块 是 多 任务 机 制 中 任务 存在 的 唯一 标识 。 在 用 户 提 交 任 务 后 ,任务 管理 为 任 
务 分 配 内 存 空间 ,将 任务 代码 载 和 到 空间 内 ,分 配 系统 资源 ,并 为 之 创建 任务 控制 块 (Task 
Control Block,TCB) 。 一 般 来 说 ,TCB 保存 了 与 任务 相关 的 如 下 信息 : 

(1) 任务 ID ,标识 任务 的 唯一 序号 。 

(2) 任务 状态 ,任务 的 当前 状态 ,如 就 绪 .运行 等 。 

(3) 任务 类 型 ,任务 的 类 型 ,包括 硬 实时 任务 、 软 实时 任务 和 后 台 任 务 等 。 

(4) 任务 优先 级 ,标识 任务 的 优先 级 别 , 描 述 任务 执行 的 优先 度 。 
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(5) 任务 上 下 文 指针 ,指向 保存 任务 上 下 文 的 位 置 。 

(6) 任务 存储 器 指针 ,指向 任务 代码 存储 器 数据 存储 器 和 堆栈 的 指针 。 

(7) 任务 系统 资源 指针 ,任务 使 用 的 指向 系统 资源 (包括 信号 量 等 ) 的 指针 。 

(8) 任务 指针 ,指向 其 他 TCB 的 指针 。 

(9) 其 他 参数 ,其 他 相关 任务 参数 。 

每 个 任务 的 任务 控制 块 采 用 链表 的 方式 进行 存储 ,根据 任务 的 状态 ,分 为 多 种 任务 控制 
块 链 表 。 

3. 任务 上 下 文 切换 

任务 上 下 文 是 指 任务 运行 的 环境 。 例 如 ,针对 x86 的 CPU, 任务 上 下 文 可 包括 程序 计 
数 器 .堆栈 指针 和 通用 寄存 器 的 内 容 。 

任务 上 下 文 管理 负责 垦 入 式 操作 系统 内 核 中 任务 管理 部 分 对 任务 寄存 器 上 下 文 的 创 
建 、 删 除 以 及 切换 等 操作 。 任 务 的 寄存 器 上 下 文 是 操作 系统 内 核 所 管理 的 任务 的 重要 组 成 
部 分 ,是 CPU 内 核 的 寄存 器 中 内 容 的 映像 ,因此 上 下 文 管理 的 实现 依赖 于 CPU 内 核 中 寄 
存 器 的 组 织 ,是 与 体系 结构 密切 相关 的 。 通 用 硬件 抽象 层 的 任务 上 下 文 管理 统一 定义 体系 
结构 中 的 寄存 器 上 下 文 的 保护 格式 ,提供 了 任务 管理 对 任务 上 下 文 的 基本 操作 的 API 
接口 。 

多 任务 系统 中 ,上 下 文 切换 是 指 CPU 的 控制 权 由 运行 任务 转移 到 另外 一 个 就 绪 任 务 
时 所 发 生 的 事件 ,当前 运行 任务 转 为 就 绪 ( 或 者 挂 起 删除) 状态 , 另 一 个 被 选 定 的 就 绪 任务 
成 为 当前 任务 。 上 下 文 切 换 包括 以 下 6 个 基本 步骤 : 保存 当前 任务 的 运行 环境 ;更 新 当前 
运行 任务 的 状态 ;移动 当前 任务 到 相应 队列 ;调度 另 一 个 任务 ;更改 其 状态 为 运行 ;恢复 将 要 
运行 任务 的 上 下 文 运行 环境 。 上 下 文 的 内 容 依赖 于 具体 的 CPU ,而 且 与 调度 的 过 程 有 关 。 

4. 任务 控制 

任务 控制 主要 是 完成 对 任务 状态 的 直接 控制 与 访问 。 通 常任 务 控制 是 通过 系统 调用 来 
体现 的 ,主要 包括 创建 任务 删除 任务 , 挂 起 任务 .唤醒 任务 .设置 任务 属性 和 改变 任务 优先 
级 等 内 容 , 这 些 控制 一 般 采 用 原 语 的 形式 实现 。 

创建 任务 的 过 程 是 分 配 任务 控制 块 的 过 程 。 在 创建 任务 时 ,通常 需要 确定 任务 的 名 字 
和 任务 的 优先 级 等 内 容 ,确定 任务 所 能 使 用 的 堆栈 区 域 ,在 任务 创建 成 功 后 ,通常 会 向 用 户 
返回 一 个 标识 该 任务 的 ID ,以 实现 对 任务 的 引用 管理 。 

删除 任务 是 指 将 任务 从 系统 中 去 掉 , 释 放 对 应 任务 控制 块 的 过 程 。 

挂 起 任务 是 把 任务 变 为 等 待 状态 ,唤醒 任务 操作 则 是 把 任务 转换 为 就 绪 状 态 。 

设置 任务 属性 可 以 用 来 设置 任务 的 抢占 、 时 间 片 等 特性 ,以 确定 是 否 允 许 任务 在 执行 过 
程 中 被 抢占 或 是 对 同 优先 级 任务 采用 时 间 片 轮转 方式 运行 等 。 

改变 任务 优先 级 用 来 根据 需要 改变 任务 的 当前 优先 级 。 

通过 获取 任务 信息 可 以 获得 任务 的 当前 优先 级 、 任 务 属性 、 任 务 名字、 任务 上 下 文 和 任 
务 状态 等 内 容 ,便于 用 户 进行 决策 。 


12.2.2 任务 状态 和 任务 状态 迁移 


由 于 多 任务 机 制 管 理 中 ,任务 要 参与 资源 的 竞争 ,只 有 在 所 需 资源 得 到 满足 的 情况 下 才 
能 得 到 执行 。 然 而 ,任务 拥有 的 资源 情况 是 不 断 变化 的 ,这 将 导致 任务 状态 也 表现 出 不 断 变 
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化 的 特性 。 不 同 的 实时 内 核实 现 方式 对 状态 的 定义 不 尽 相 同 ,但 都 包括 以 下 3 种 基本 状态 : 

(1) 等 待 ,任务 在 等 待 I/O 完成 或 者 等 待 某 事 件 的 发 生 。 

(2) 就 绪 , 任 务 已 经 得 到 需要 运行 的 资源 ,并 等 待 获得 处 理 器 资源 。 

(3) 执行 ,任务 获得 处 理 器 和 其 他 所 有 需要 的 资源 ,相关 代码 正在 被 运行 。 

在 单 处 理 器 系统 中 ,任何 时 候 只 有 一 个 任务 处 于 运行 态 。 如 果 没 有 任何 任务 需要 运行 ， 
那么 内 核 会 运行 一 个 空闲 任务 。 任 何 一 个 可 以 执行 的 任务 都 必须 处 于 就 绪 态 ,实时 内 核 会 
从 所 有 就 绪 的 任务 中 使 用 合适 的 调度 策略 选择 一 个 运行 。 当 一 个 任务 请 求 VO 操作 或 者 
等 待 信号 量 时 将 会 处 于 等 待 态 。 

在 一 定 条 件 下 ,任务 会 在 不 同 的 状态 之 间 进行 转化 , 称 为 任务 状态 迁移 。 任 务 状态 迁移 
情况 如 图 12. 5 所 示 。 对 于 处 于 就 绪 态 的 任务 ,获得 CPU 后 ,处 于 运行 态 ; 处 于 运行 态 的 任 
务 如 果 被 高 优先 级 任务 所 抢占 ,或 者 执行 的 时 间 片 期 满 ,任务 又 回 到 就 绪 态 ;运行 的 任务 如 
果 需 要 等 待 某 些 资源 ,任务 被 切换 到 等 待 态 ;对 于 等 待 态 的 任务 ,如 果 等 待 的 资源 或 事件 满 
足 ,就 会 转换 为 就 绪 态 ,等 待 被 调度 执行 。 


获得 CPU 


被 高 优先 级 任务 抢 
占 ， 或 执行 期 满 


获得 资源 请 求 资源 


图 12.5 任务 状态 迁移 


图 12.6 描述 了 3 个 任务 状态 的 迁移 过 程 。 图 中 包含 3 个 任务 和 一 个 调度 程序 。 调 度 
程序 确定 下 一 个 需要 投入 运行 的 任务 ,因此 调度 程序 本 身 也 占用 一 定 的 处 理 时 间 。 
| 
co Oi ea vt 
mar 图 图 国 国 


图 12.6 任务 状态 迁移 示意 


12.2.3 任务 调度 


调度 是 内 核 的 主要 职责 之 一 ,任务 调度 用 来 确定 多 任务 环境 下 任务 执行 的 顺序 和 在 获 
得 CPU 资源 后 能 够 执行 的 时 间 长 度 。 

任务 调度 所 要 解决 的 问题 包括 3 个 部 分 : 第 一 ,确定 按 什么 原则 分 配 CPU 资源 , 即 任 
务 调度 算法 ;第 二 ,确定 何 时 分 配 CPU 资源 , 即 任务 调度 的 时 机 ;第 三 ,如 何 分 配 CPU 资 
源 , 即 任务 调度 的 过 程 。 

实时 操作 系统 中 大 都 采用 抢占 式 调 度 算法 ,这样 , 硬 实时 任务 能 够 打 断 软 实 时 任务 的 执 
行 ,从 而 确保 硬 实时 任务 的 截止 时 间 能 够 得 到 满足 。 常 见 的 调度 算法 包括 基于 优先 级 的 抢 
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占 式 调度 算法 和 时 间 片 轮转 调度 算法 等 。 

1. 基于 优先 级 的 抢占 式 调度 算法 

基于 优先 级 的 抢占 式 调度 算法 的 基本 思想 是 ,具有 最 高 优先 级 的 任务 先 执行 。 每 个 任 
务 都 赋予 优先 级 。 任 务 越 重 要 ,赋予 的 优先 级 就 越 高 。 当 就 绪 队 列 中 有 一 个 任务 具有 上 比 当 
前 执行 任务 更 高 的 优先 级 时 ,实时 内 核 进行 任务 切换 ,将 当前 任务 停止 执行 ,保存 其 上 下 文 ， 
并 把 CPU 的 控制 权 交 给 更 高 优先 级 的 任务 ,使 其 运行 。 

优先 级 的 分 配方 式 可 分 为 静态 分 配 和 动态 分 配 两 种 。 静 态 优先 级 是 指 应 用 程序 执行 过 
程 中 诸 任 务 的 优先 级 不 变 。 在 静态 优先 级 系统 中 ,各 个 任务 以 及 它们 的 时 间 约 束 在 程序 编 
译 时 是 已 知 的 。 动 态 优先 级 指 应 用 程序 执行 过 程 中 ,任务 的 优先 级 是 可 变 的 。 

2. 时 间 片 轮转 调度 算法 

当 两 个 或 两 个 以 上 的 任务 具有 相同 的 优先 级 , 且 这 些 就 绪 任务 是 优先 级 最 高 的 任务 时 ， 
内 核 按照 这 些 任务 就 绪 的 先后 次 序 调 度 ,允许 一 个 任务 运行 事先 确定 的 一 段 时 间 ,然后 又 调 
度 第 二 个 任务 执行 确定 的 一 段 时 间 ,依次 类 推 地 循环 ,这 种 调度 算法 为 时 间 片 轮转 算法 。 其 
中 ,每 个 任务 所 执行 的 一 段 时 间 为 时 间 片 。 内 核 在 满足 以 下 条 件 时 ,把 CPU 控制 权 交 给 下 

一 个 就 绪 态 的 任务 : 

(1) 当前 任务 运行 的 时 间 片 到 期 。 

(2) 当前 任务 在 时 间 片 还 没 结 束 时 已 经 完成 了 。 

多 数 实时 内 核 采用 基于 优先 级 调度 的 算法 ,但 有 些 实时 内 核 常常 会 实现 混合 调度 方案 。 
例如 ,在 Linux 系统 中 ,调度 算法 最 基本 的 一 类 是 基于 优先 级 的 调度 ,优先 级 高 的 任务 先 运 
行 , 而 相同 优先 级 的 任务 按照 轮转 方式 进行 调度 ,另外 ,Linux 也 实现 了 基于 动态 优先 级 的 
调度 方法 。 一 开始 ,利用 静态 优先 级 的 方法 设置 任务 的 优先 级 ,然而 它 允 许 调度 程序 根据 需 
要 来 提升 或 降低 优先 级 。 

当 调 度 程 序 决定 新 的 任务 获得 CPU 的 使 用 权时 ,这 时 内 核 将 执行 任务 切换 。 任 务 切 
换 过 程 为 : 首先 保存 当前 任务 的 上 下 文 , 即 CPU 寄存 器 中 的 全 部 内 容 。 这 些 内 容 可 以 保存 
在 任务 的 自己 的 栈 中 ,也 可 以 保存 在 TCB 中 。 然 后 ,将 需要 运行 的 任务 的 上 下 文 从 该 任务 
的 栈 中 重新 装 入 CPU 的 寄存 器 ,并 开始 运行 。 任 务 切换 过 程 增加 了 应 用 程序 的 额外 负 蓓 。 
CPU 的 内 部 寄存 器 越 多 ,额外 负荷 就 越 重 。 


12.2.4 任务 间 通 信 


由 于 实时 操作 系统 中 存在 任务 的 调度 ,各 个 任务 之 间 不 可 避免 地 存在 相互 协同 的 关系 ， 
这 种 协同 就 是 任务 间 的 通信 。 一 般 艇 入 式 操 作 系 统 都 会 提供 各 种 任务 间 通 信 的 方法 ,包括 ， 

(1) 共享 内 存 机 制 ,数据 的 简单 共享 。 

(2) 信号 量 机 制 , 基 本 的 互 斥 与 同步 。 

(3) 消息 队列 与 管道 ,同一 CPU 内 多 任务 间 消 息 传递 。 

在 散 入 式 多 任务 系统 中 ,嵌入 式 实时 多 任务 应 用 是 由 多 个 任务 、 多 个 中 断 处 理 过 程 以 及 
伐 入 式 实 时 操作 系统 组 成 的 有 机 整体 。 因 此 ,各 种 任务 之 间 存 在 着 不 同 的 关系 ,它们 之 间 必 
9 
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空间 来 完成 任务 之 间 信 息 的 交换 。 如 图 12.7 所 示 。 由 于 大 部 分 嵌入 式 系 统 的 任务 共存 于 
单一 的 线性 地 址 空间 ,在 多 个 任务 间 共 享 数据 结构 非常 容易 ,只 要 通信 双方 采用 协商 一 致 的 
数据 结构 即 可 。 这 些 一 致 的 数据 结构 包括 各 种 类 型 的 全 局 变量 、 双 向 链表 和 环形 队列 等 复 
杂 的 数据 结构 。 


任务 1 共享 内 存 区 域 | 任务 2 


图 12.7 共享 内 存 机 制 示意 图 


当 某 一 地 址 空间 用 于 数据 交换 时 ,为 了 避免 冲突 ,对 于 内 存 的 锁定 是 非常 重要 的 。 两 个 
或 多 个 任务 读 写 某 些 共享 数据 时 ,最 后 的 结果 取决 于 任务 运行 的 精确 时 序 , 有 可 能 得 到 错误 
值 , 这 样 必须 以 某 种 手段 确保 当 一 个 任务 在 使 用 一 个 共享 变量 或 文件 时 ,其 他 任务 不 能 做 同 
样 的 操作 。 锁 定 内 存 主要 有 关中 断 ,抢占 禁止 和 用 信号 量 锁定 资源 等 方法 。 一 般 来 说 ,关中 
断 是 最 有 效 的 解决 互 斥 的 方法 。 但 这 种 方法 对 于 实时 应 用 来 说 ,由 于 阻止 了 系统 对 外 部 事 
件 的 响应 ,无 法 满足 实时 性 的 要 求 。 同 样 ,中 断 延 迟 也 是 不 能 接受 的 。 

2. 信和 号 量 机 制 

信号 量 机 制 是 任务 间 少 量 信息 的 通信 提供 同步 和 互 斥 的 主要 手段 。 通 过 信号 量 机 制 
可 以 对 共享 资源 上 锁 ,从 而 限制 对 共享 资源 的 同时 操作 ,协调 任务 的 执行 。 针 对 不 同类 型 的 
问题 ,在 嵌入 式 实时 操作 系统 中 可 以 使 用 以 下 几 种 信号 量 ， 

(1) 二 进 制 信号 量 , 用 于 解决 同步 问题 的 最 常用 信号 量 。 

(2) 互 斥 信号 量 ,为 解决 具有 内 在 互 斥 问题 ,优先 级 继承 ` 删 除 安全 和 递归 等 情况 而 最 
优化 的 特殊 的 二 进 制 信号 量 。 

(3) 计数 信号 量 , 用 于 解决 一 种 资源 的 多 个 实例 需要 保护 的 信号 量 。 

在 租 入 式 实时 系统 中 ,这 些 信号 量 将 根据 用 途 而 在 具体 实现 中 做 专门 处 理 , 以 提高 程序 
的 执行 效率 和 可 靠 性 。 

3. 消息 队列 与 管道 

冒号 量 机 制 提 供 的 信息 量 是 非常 有 限 的 ,通常 只 是 作为 解决 通信 中 涉及 的 互 斥 和 同步 
问题 的 底层 机 制 。 而 消息 队列 作为 一 种 更 高 级 的 通信 方式 ,能 够 处 理 同 一 处 理 咒 的 各 个 任 
务 间 传 递 任意 长 度 ( 理 论 上 只 受 物理 内 存 和 机 器 字 长 限制 ) 的 信息 。 消 息 队 列 是 一 个 类 似 于 
缓冲 区 的 对 象 ,通过 消息 队列 ,任务 之 间 发 送 和 接收 消息 ,实现 带 数 据 的 通信 和 同步 。 如 
图 12.8 所 示 ,任务 1 和 任务 2 之 间 采 用 两 个 消息 队列 来 完成 双 工 通信 。 


消息 队列 1 


消息 队列 2 
图 12.8 任务 间 消 息 队 列 通信 示意 医 


图 12. 8 中 任务 与 消息 队列 之 间 是 单 向 的 ,任务 1 和 任务 2 分 别 发 送 消息 到 消息 队列 2 


。277， 


和 消息 队列 1 ,而 两 者 分 别 从 消息 队列 1 和 消息 队列 2 中 检索 消息 。 
在 客户 /服务 器 模型 中 ,一 般 采 用 多 个 消息 队列 来 维护 通信 。 服 务 器 创建 请 求 队列 ,并 
侦 听 队列 上 的 客户 请 求 ,客户 请 求 将 放 入 不 同 的 请 求 队列 ,并 在 各 自 创 建 的 响应 队列 上 取 回 


服务 器 响应 数据 ,如 图 12. 9 所 示 。 
AS ) 一 一 
2 响应 消息 队列 


图 12.9 客户 /服务 器 消息 队列 通信 示意 图 


向 应 消息 队列 1 


请 求 消息 队列 


在 蔡 入 式 实时 操作 系统 中 ,应 用 消息 队列 将 要 更 多 地 考虑 优先 级 。 消 息 队列 的 优先 级 
主要 是 消息 自身 的 优先 级 和 阻塞 任务 队列 的 优先 级 。 消 息 自身 优先 级 决定 了 消息 队列 中 多 
条 消息 提交 给 接收 任务 的 顺序 ,这 个 优先 级 对 消息 接收 者 是 透明 的 ,接收 者 总 是 接收 链 队 列 
首部 的 消息 ;阻塞 任务 队列 优先 级 决定 阻塞 任务 队列 中 多 个 发 送 者 任务 或 多 个 接收 者 任务 
谁 先 被 执行 的 顺序 。 一 个 消息 队列 包含 了 发 送 者 阻塞 队列 和 接收 者 阻塞 队列 ,对 于 同一 个 
消息 队列 而 言 ,两 个 优先 级 是 一 致 的 。 

管道 是 UNIX 操作 系统 中 传统 的 进程 通信 技术 , 它 主要 实现 单 向 数据 交换 ,在 管道 创 
立时 返回 两 个 端口 的 两 个 描述 符 ,数据 通过 一 个 描述 符 写 ,通过 另 一 个 描述 符 读 ,数据 在 管 
道内 像 一 个 非 结 构 字 节 流 , 按 FIFO 的 次 序 从 管道 中 读 出 。 

与 消息 队列 不 一 样 的 是 ,管道 不 存储 消息 ,在 管道 中 流动 的 数据 也 不 是 结构 化 数据 ,而 
是 由 字 节 流 组 成 的 。 另 外 ,管道 中 的 数据 不 区 分 优先 级 ,数据 流 严格 地 按照 先进 先 出 的 方式 
执行 。 

在 蔡 入 式 实时 操作 系统 中 ,管道 由 于 其 简单 灵活 而 被 应 用 。 因 为 管道 支持 select() , 任 
务 可 以 同时 等 待 包括 管道 在 内 的 一 系列 I/O 设备 上 的 数据 ,而 且 管 道 提供 的 几 个 IO 控制 
命令 也 比较 有 用 。 


12.2.5 VxWorks 任务 管理 


VxWorks 是 美国 WindRiver 公司 设计 开发 的 一 种 实时 多 任务 的 谋 和 人 式 操作 系统 , 它 由 
400 多 个 相对 独立 的 、 短 小 精炼 的 目标 模块 组 成 ,以 其 良好 的 持续 能 力 、 高 性 能 的 内 核 、 友 好 
的 用 户 开发 环境 和 卓越 的 实时 性 被 广泛 地 应 用 于 通信 、 军 事 、 航 空 和 航天 等 高 精 尖 技术 及 实 
时 性 要 求 极 高 的 领域 中 ,如 卫星 通信 ,军事 演习 、 弹 道 制导 和 飞机 导航 等 。 用 户 可 根据 需要 
选择 适当 的 模块 来 裁剪 和 配置 系统 ,系统 的 链接 器 也 可 按 应 用 的 需要 自动 链接 一 些 目 标 模 
块 ,这样 , 通 过 目标 模块 之 间 的 按 需 组 合 ,可 得 到 许多 满足 功能 需求 的 应 用 。 本 节 将 从 任务 
的 状态 、 调 度 算法 及 任务 之 间 的 通信 这 几 方 面 介绍 VxWorks 的 任务 管理 功能 。 

1. 任务 控制 块 

VxWorks 中 任务 是 竞争 系统 资源 的 最 小 运行 单位 。 在 VxWorks 内 核 中 ,任务 能 快速 
共享 系统 的 绝 大 部 分 资源 ,同时 有 独立 的 上 下 文 来 控制 个 别 任务 的 执行 。 

对 于 每 一 个 任务 ,系统 使 用 任务 控制 块 (TCB) 来 描述 任务 ,每 一 个 任务 与 一 个 TCB 关 
联 。TCB 的 组 成 如 下 : 
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(1) 任务 的 当前 状态 ,描述 任务 当前 所 处 的 状态 。 

(2) 任务 的 优先 级 ,采用 0 一 255 的 数字 表示 ,数字 越 小 ,优先 级 越 高 。 

(3) 资源 列表 ,描述 任务 所 要 等 待 的 事件 或 资源 。 

(4) 任务 程序 码 的 起 始 地 址 ,任务 所 存放 的 地 址 。 

(5) 初始 堆栈 指针 等 。 

另外 ,TCB 还 被 用 来 存放 任务 的 上 下 文 ,任务 的 上 下 文保 存 的 是 一 个 任务 进行 切换 时 
所 要 保存 的 当前 系统 状态 相关 的 所 有 信息 。 

2. 任务 状态 及 状态 转换 

VxWorks 中 任务 的 基本 状态 分 为 4 种 ,分 别 是 就 绪 态 (READY) 、 悬 置 态 (PEND) 、 休 
眠 态 (SUSPEND) 和 延迟 态 (DELAY) 。 

(1) 就 绪 态 : 任务 只 等 待 系统 分 配 CPU 资源 。 

(2) 悬 置 态 : 任务 需 等 待 某 些 不 可 利用 的 资源 而 被 阻塞 。 

(3) 休眠 态 : 如 果 系 统 不 需要 某 一 个 任务 工作 , 则 这 个 任务 处 于 休眠 状态 。 

(4) 延迟 态 : 任务 被 延迟 时 所 处 的 状态 。 

任务 被 创建 以 后 进入 挂 起 态 ,需要 通过 特定 的 操作 使 被 创建 的 任务 进入 就 绪 态 ,这 一 
作 执 行 速度 很 快 ,使 应 用 程序 能 够 提前 创建 任务 ,并 以 一 种 快捷 的 方式 激活 该 任务 。 we 
态 之 间 的 转换 如 图 12. 10 所 示 。 


最 高 优先 级 任务 正 执行 


taskInit() 
图 12.10 VxWorks 中 的 状态 转换 


VxWorks 中 状态 之 间 的 转换 通过 一 系列 的 函数 调用 来 实现 ,如 表 12. 1 所 示 。 
表 12.1 VxWorks 有 关 状 态 转 换 的 调用 函数 


状态 转换 调用 函数 
就 绪 态 一 悬 置 态 semTake()/msgQReceive() 
就 绪 态 一 延迟 态 taskDelay() 
就 绪 态 一 休眠 态 taskSuspend() 
悬 置 态 一 就 绪 态 semGive()/msgQSend() 
悬 置 态 一 休眠 态 taskSuspend() 


延迟 态 一 休眠 态 
休眠 态 一 就 绪 态 
休眠 态 一 悬 置 态 
休眠 态 一 延 退 态 


expired delay 
taskSuspend() 
taskResume()/taskActivate() 


taskResume() 


taskResume() 
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3. 任务 调度 

VxWorks 多 任务 的 实现 是 由 中 断 驱动 的 , 即 在 每 个 系统 时 钟 中 断 中 实现 任务 的 调度 。 
VxWorks 的 任务 调度 是 采用 基于 抢占 式 优先 级 调度 和 时 间 片 轮转 调度 混合 的 方法 。 

抢占 式 优先 级 调度 算法 是 VxWorks 中 默认 的 算法 ,首先 ,每 个 任务 有 256 个 等 级 , 采 
用 0 一 255 的 数字 表示 ,数字 越 小 表示 优先 级 越 高 。 没 有 处 于 甚 置 态 或 休眠 态 的 最 高 优先 级 
任务 将 一 直 运 行 下 去 。 当 更 高 优先 级 的 任务 由 就 绪 态 进入 运行 时 ,该 任务 可 以 打 断 低 优先 
级 的 任务 而 抢先 执行 ,系统 内 核 立 即 保存 当前 任务 的 上 下 文 ,切换 到 更 高 优先 级 的 任务 。 只 
有 在 高 优先 级 的 任务 执行 完 后 , 低 优先 级 的 任务 才 可 以 执行 。 

对 于 相同 优先 级 的 任务 而 言 , 系 统 采用 时 间 片 轮转 调度 算法 。 系 统 给 处 于 就 绪 态 的 每 
个 同 优先 级 的 任务 分 配 一 个 相同 的 执行 时 间 片 。 时 间 片 的 长 度 可 由 系统 调用 
KernelTimeSlice() 通 过 输入 参数 值 来 指定 。 每 个 任务 都 有 一 个 运行 时 间 计 数 器 ,任务 运行 
时 每 一 时 间 滴 答 (tick) 加 1。 一 个 任务 用 完 时 间 片 之 后 ,就 进行 任务 切换 ,停止 执行 当前 运 
行 的 任务 ,将 它 放 和 人 队列 尾部 ,对 运行 时 间 计 数 器 置 零 , 并 开始 执行 就 绪 队 列 中 的 下 一 个 任 
务 。 当 运行 任务 被 更 高 优先 级 的 任务 抢占 时 ,此 任务 的 运行 时 间 计数 器 被 保存 ,直到 该 任务 
下 次 运行 时 。 

另外 ,任务 在 执行 的 过 程 中 可 以 调用 taskLock() 函 数 来 中 止 任务 调度 ,从 而 保证 该 任 
务 的 执行 不 会 被 其 他 任务 所 打 断 ,只 有 在 调用 taskUnlock() 后 才 会 恢复 任务 调度 。 需 要 注 
意 的 是 ,如 果 调 用 taskLock() 的 任务 在 调用 taskUnlock() 之 前 又 被 挂 起 了 (可 能 堵塞 在 信 
号 量 上 等 ) ,那么 系统 就 会 搜索 其 他 任务 中 优先 级 最 高 的 那 一 个 ,并 执行 它 , 而 在 调用 
taskLock() 的 任务 恢复 执行 后 ,任务 调度 又 会 被 中 止 。 

当 程序 代码 和 数据 出 错时 (如 非法 命令 .总 线 或 地 址 错误 .被 零 除 等 ) ,VxWorks 将 进入 
异常 处 理 , 使 引起 异常 的 任务 进入 休眠 态 ,保存 任务 在 异常 出 错 处 的 状态 值 。 内 核 和 其 他 任 
务 继续 执行 。 

4. VxWorks 任务 管理 函数 

VxWorks 任务 管理 函数 如 表 12. 2 所 示 。 


表 12.2 ”VxWorks 任务 管理 函数 


子 数 名 功 能 
kernelTimeSlice() 控制 轮 询 式 调度 程序 
taskLock() 取消 任务 的 再 调度 
taskUnlock() 允许 任务 的 再 调度 
taskSpawn() 生成 (创建 和 激活 ) 一 个 新 任务 
taskCreate() 创建 一 个 新 任务 ,但 不 激活 它 
taskActivate() 激活 一 个 已 经 创建 的 任务 
taskSuspend() 挂 起 一 个 任务 
taskResume() 恢复 挂 起 任务 的 执行 
taskRestart() 重新 开始 一 个 任务 的 执行 ( 即 从 头 执行 ) 
taskDelay() 延 时 任务 , 延 时 单位 是 时 间 片 
taskIdSelf() 得 到 调用 任务 的 id( 正 在 运行 的 ) 
taskldVerify() 验证 一 个 指定 任务 是 否 存 在 
taskOptionsGet() 获得 用 户 自 定 义 任务 参数 
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函 数 名 


功 能 


需求 ,因此 ,在 嵌入 式 实时 操作 系统 中 ,通常 需要 根据 系统 的 要 求 采用 特定 的 内 存 管 理 。 


taskOptionsSet() 
taskIdListGet() 
taskInfoGet() 
taskPriorityGet() 
taskPrioritySet() 
taskRegsSet() 
taskIsSuspended() 
taskIsReady() 
exit() 
taskDelete() 
taskSafe() 
taskUnsafe() 


nanosleep() 


5. 同步 与 通信 


VxWorks 中 的 同步 与 通信 的 实现 采用 了 各 种 机 制 ,包括 信号 量 .消息 队列 .管道 和 信 


设置 用 户 自 定 义 任 务 参数 

将 所 有 活动 状态 的 任务 id 填写 到 个 数组 中 
得 到 一 个 任务 的 信息 

获得 任务 的 优先 级 

改变 任务 优先 级 


设置 一 个 任务 的 寄存 器 (但 是 不 能 被 当前 任务 使 用 ) 


检查 一 个 任务 是 否 在 悬挂 状态 (suspended) 
检查 一 个 任务 是 否 准备 运行 就 绪 
结束 正在 运行 的 任务 ,释放 内 存 

结束 制定 的 任务 ,释放 内 存 

保护 当前 任务 ,防止 被 删除 

取消 taskSafe() 操 作 , 即 能 够 删除 当前 任务 


延 时 任务 , 延 时 单位 是 时 间 片 


表 12. 3 给 出 了 VxWorks 中 所 使 用 的 各 种 同步 与 通信 机 制 采 用 的 函数 。 


函 数 名 
semTake() 
semGive() 
semFlush() 
semBCreate() 
semMCreate() 
semCCreate() 
semDelete() 
msgQCreate() 
msgQDelete() 
msgQSend() 
msgQReceive() 


sigvec() 


表 12.3 同步 与 通信 机 制 相关 函数 表 
函数 说 明 

获取 一 个 信号 量 

给 出 信号 量 

解锁 所 有 正 等 待 某 一 信号 量 的 任务 
创建 (产生 并 激活 ) 一 个 二 进 制 信号 量 
创建 (产生 并 激活 ) 一 个 互 斥 信号 量 
创建 (产生 并 激活 ) 一 个 计数 信号 量 

中 止 并 删除 信号 量 

创建 (产生 并 激活 ?消息 队列 

中 止 并 删除 消息 队列 

向 消息 队列 发 送 消息 

从 消息 队列 接收 消息 


用 户 可 通过 该 调用 把 自己 的 处 理 函 数 连接 在 特定 的 异常 处 理 信号 上 


12.3 内 存 管 理 


[sl 


号 


内 存 管 理 机 制 是 髋 入 式 系 统 中 一 个 重要 的 内 容 , 它 必须 满足 实时 性 、 可 靠 性 和 高 效 性 的 


大 体 上 来 说 , 租 入 式 系 统 所 用 到 的 内 存 管 理 机 制 包括 虚拟 内 存 管理 机 制 和 非 虚拟 内 存 
管理 机 制 。 采 用 虚拟 内 存 管理 机 制 的 嵌入 式 系统 中 含有 MMU ,可 以 用 于 完成 虚 地 址 到 物 
理 地 址 的 转换 ,从 而 使 系统 可 以 运行 体积 比 物理 内 存 还 要 大 的 应 用 程序 。 而 在 许多 小 型 通 
入 式 系 统 中 并 未 实现 虚拟 内 存 管理 机 制 ,常见 的 非 虚拟 内 存 管 理 机 制 是 动态 分 区 内 存 管理 
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机 制 , 可 以 满足 多 道 程序 设计 的 需求 ,允许 多 个 用 户 程序 共享 内 存 空 间 。 
12.3.1 动态 内 存 管理 机 制 


动态 内 存 管理 机 制 主要 管理 空闲 内 存 块 , 采 用 最 佳 适 应 算法 和 首次 适应 算法 进行 内 存 
分 配 。 最 佳 适 应 算法 将 所 有 的 空闲 内 存 块 由 小 到 大 链接 ,首次 适应 算法 中 的 空闲 内 存 块 是 
按 地 址 由 小 到 大 进行 链接 的 。 在 进程 提出 申请 的 时 候 , 系 统 将 从 空闲 块 的 首 地 址 开始 查找 ， 
找到 满足 需求 的 内 存 后 ,返回 分 配 起 始 地 址 。 

动态 内 存 分 配 会 导致 响应 和 执行 时 间 不 确定 、 内 存 外 碎片 等 问题 ,但 是 它 的 实现 机 制 灵 
活 ,给 程序 实现 带 来 极 大 的 方便 ,有 的 应 用 环境 中 动态 内 存 分 配 甚 至 是 必 不 可 少 的 。 比 如 ， 
能 入 式 系统 中 使 用 的 网 络 协议 栈 , 在 特定 的 平台 下 ,为 了 比较 灵活 地 调整 系统 的 功能 ,在 系 
统 中 各 个 功能 之 间作 出 权衡 ,必须 支持 动态 内 存 分 配 。 

大 多 数 的 系统 是 硬 实时 系统 和 软 实时 系统 的 综合 ,也 就 是 说 ,系统 中 的 一 部 分 任务 有 严 
格 的 时 限 要 求 , 而 另 一 部 分 只 是 要 求 完成 得 越 快 越 好 。 按 照 RMS (Rate Monotonous 
Scheduling) 理 论 ,这 样 的 系统 必须 采用 抢先 式 任务 调度 ;而 在 这 样 的 系统 中 ,就 可 以 采用 动 
态 内 存 分 配 来 满足 那些 可 靠 性 和 实时 性 要 求 不 那么 高 的 任务 。 采 用 动态 内 存 分 配 的 好 处 就 
是 给 设计 者 很 大 的 灵活 性 ,可 以 方便 地 将 原来 运行 于 非 舱 入 式 操作 系统 的 程序 移植 到 骨 入 
式 系统 中 。 大 多 数 实时 操作 系统 提供 了 动态 内 存 分 配 接口 ,例如 malloc 和 free 函数 。 


12.3.2 VxWorks 动态 内 存 管 理 函 数 


VxWorks 中 也 采用 了 动态 内 存 管理 机 制 ,动态 内 存 分 配 采 用 最 先 匹 配 (first-fit) 算 法 ， 
即 从 空闲 链表 中 查找 内 存 块 ,然后 从 高 地 址 开始 查找 , 当 找到 第 一 个 满足 分 配 请 求 的 空闲 内 
存 块 时 ,就 分 配 所 需 内 存 并 修改 该 空闲 块 的 大 小 。 空 闲 块 的 剩余 部 分 仍然 保留 在 空闲 链表 
中 。 当 从 大 的 内 存 块 中 分 配 出 新 的 内 存 块 时 ,需要 将 新 内 存 块 头 部 的 一 块 空 间 ( 称 为 “ 块 
头 ”) 用 来 保存 分 配 .回收 和 合并 等 操作 的 信息 ,因此 ,实际 占用 的 内 存 大 小 是 分 配 请 求 的 内 
存 大 小 与 块头 开销 之 和 。 分 配 函 数 malloc() 返 回 的 地 址 是 分 配 请 求 所 获 可 用 内 存 的 起 始 地 
址 ,为 优化 性 能 ,malloc() 会 自动 对 齐 边 界 , 分配 的 内 存 的 起 始 地 址 和 大 小 都 是 边界 值 的 整 
数 倍 ,因此 有 可 能 造成 内 部 碎片 。 块 头 的 开销 与 处 理 器 的 体系 结构 有 关 , 对 于 x86 体系 结构 
来 说 ,块头 的 开销 是 8B ,通常 这 部 分 会 被 自动 以 4B 边界 对 齐 , 以 减少 出 现 碎 片 的 可 能 并 优 
化 性 能 。 

VxWorks 提供 了 多 种 分 配 和 释放 内 存 的 函数 以 满足 不 同 的 要 求 。 其 中 基本 的 分 配 与 
释放 函数 是 memPartAlloc() 和 memPartFree(), 其 他 涌 数 是 在 这 两 个 函数 的 基础 上 实现 
的 ,如 表 12.4 所 示 。 


表 12.4 动态 内 存 分 配 和 释放 函数 


函 数 名 所 属 库 功能 描述 
malloc() | memPartLib 从 系统 内 存 分 区 中 分 配 指 定 大 小 的 内 存 , 与 ANSI C 兼容 
free() memPartLib 释放 由 malloc() 或 calloc() 分 配 的 内 存 块 


为 一 组 元 素 分 配 内 存 ,与 ANSI C 兼容 


calloc() 
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函 数 名 所 属 库 功能 描述 
cfree() memLib 释放 由 calloc() 分 配 的 内 存 块 
valloel) ei 从 系统 内 存 分 区 中 分 配 指 定 大 小 的 内 存 , 并 确保 所 分 配 的 内 
- 存 是 从 页 边界 开始 的 
zealloet) ena 为 指定 的 块 重新 分 配 内 存 , 新 分 配 的 内 存 可 能 不 在 原 位 置 上 ， 
但 可 以 保留 原 内 存 块 中 的 内 容 ,与 ANSI C 兼容 
i 从 系统 内 存 分 区 中 分 配 内 存 , 并 确保 内 存 块 的 起 始 地 址 是 指 
memAlign() memLib 


定 alignment 参数 的 整数 倍 
从 指定 内 存 分 区 中 分 配 内 存 ,并 确保 内 存 块 的 起 始 地 址 是 指 
定 alignment 参数 的 整数 倍 


memPartAlignedAlloc() | memPartLib 


memPartRealloc() memLib 从 指定 的 分 区 中 重新 分 配 内 存 , 并 保留 原来 内 存 块 的 内 容 
memPartAlloc() memPartLib 从 指定 内 存 分 区 中 分 配 内 存 
memPartFree() memPartLib 释放 指定 分 区 中 的 内 存 


VxWorks 5.x 也 允许 用 户 建 立 并 管理 自己 的 内 存 分 区 (memory partition) ,并 提供 相 
应 的 函数 ,如 表 12.5 所 示 。 


表 12.5 内 存 分 区 操作 函数 


memPartCreate() memPartLib 创建 内 存 分 区 
memPartAddToPool() memPartLib 向 指定 内 存 分 区 中 增加 内 存 


从 指定 分 区 中 分 配 内 存 , 并 确保 该 内 存 块 的 起 始 地 址 
在 特定 的 边界 上 


memPartAlignedAlloc() memPartLib 


每 个 分 区 有 各 自 的 分 区 ID。ID 实际 是 指向 分 区 内 存 管理 数据 结构 mem_part 的 指针 ， 
定义 在 memLib.h 中 。 


12.3.3 虚拟 内 存 管理 机 制 


有 一 些 租 入 式 处 理 絮 提供 了 MMU,MMU 具备 内 存 地 址 映射 和 寻 址 功能 , 它 使 操作 系 
统 的 内 存 管理 更 加 方便 。 如 果 存 在 MMU ,操作 系统 会 使 用 它 完 成 从 虚拟 地 址 到 物理 地 址 
的 转换 ,所 有 的 应 用 程序 只 需要 使 用 虚拟 地 址 寻 址 数据 。 这 种 使 用 虚拟 地 址 寻 址 整个 系统 
的 主 存 和 辅 存 的 方式 在 现代 操作 系统 中 被 称 为 虚拟 内 存 。MMU 便 是 实现 虚拟 内 存 的 必要 
条 件 。 

MMU 的 主要 功能 是 以 存储 页 (memory page) 为 基本 单元 ,将 虚拟 地 址 翻译 为 物理 地 
址 ,提供 内 存 访问 权限 和 控制 存储 页 Cache 支持 。 其 具体 实现 因 体系 结构 而 异 , 如 图 12. 11 
所 示 为 MMU 在 系统 中 所 处 的 位 置 。 

Linux 系统 中 实现 的 就 是 虚拟 内 存 管理 机 制 。 在 不 同 的 体系 结构 下 ,使 用 了 三 级 或 者 
两 级 页 式 管理 ,利用 MMU 完成 从 虚拟 地 址 到 物理 地 址 之 间 的 转换 ,并 采用 “ 按 需 调 页 ” 策 
略 ,实现 请 求 分 页 管理 机 制 。 
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图 12.11 MMU 的 位 置 


基于 虚拟 内 存 管 理 的 内 存 的 最 大 好 处 是 : 由 于 不 同 进程 有 自己 单独 的 进程 空间 ,十 分 
有 效 地 提高 了 系统 可 靠 性 和 安全 性 。 同 时 利用 “ 按 需 调 页 ”策略 , 既 满足 了 程序 的 运行 速度 ， 
又 节约 了 物理 内 存 空间 。 


12.3.4 VxWorks 虚拟 内 存 管理 


VxWorks 5. x 提供 两 级 虚拟 内 存 支 持 (virtual memory support): 基本 级 (basic level) 
和 完整 级 (full level)。 后 者 需要 购买 可 选 组 件 VxVMI。 
在 VxWorks 5. x 中 有 关 虚 拟 内 存 的 配置 包括 两 个 部 分 。 第 一 部 分 是 对 VxWorks 虚拟 
内 支持 级 别 和 保护 的 配置 , 表 12.6 列 出 了 这 些 选 项 。 
表 12.6 VxWorks 虚拟 内 存 配 置 常量 


组 件 
INCLUDE_MMU_BASIC 
INCLUDE_MMU_FULL 
INCLUDE_PROTECT_TEXT 
INCLUDE_ PROTECT_VEC_ TABLE 


描 述 
基本 及 虚拟 内 存 支 持 , 不 需要 组 件 VxVMI 
完整 级 虚拟 内 存 支 持 , 需 要 组 件 VxVMI 
写 保 护 text 段 , 需 要 组 件 VxVMI 
写 保护 异常 向 量 表 , 需 要 组 件 VxVMI 


以 上 配置 一 般 在 BSP 的 config. h 中 完成 。 

第 二 部 分 是 内 存 页 表 的 划分 和 属性 配置 。 配 置 包括 BSP 的 config.h 中 的 VM_PAGE_ 
SIZE 和 sysLib. c 中 的 sysPhysMemDesc。 

VM_PAGE_SIZE 定义 了 CPU 默认 的 页 的 大 小 , 需 参 照 CPU 手册 的 MMU 部 分 定义 
该 值 。 

sysPhysMemDesc 用 于 初始 化 MMU 的 TLB 表 , 它 是 以 PHYS_MEM_DESC 为 元 素 
的 常量 数组 。PHYS_MEM_DESC 在 vmLib. h 中 定义 ,用 于 部 分 内 存 的 虚拟 地 址 到 物理 地 
址 的 映射 : 

typedef struct phys mem desc 

‘ 


void virtualAddr; /x* 虚拟 地 址 * / 

voidx physicalAddr; /< 虚拟 内 存 的 物理 地 址 * / 

UNIT len; /* 这 部 分 内 存 的 大 小 */ 

UNIT initialStateMask; 

UNIT initialStatey /* 设 置 这 部 分 内 存 的 初始 状态 * / 


}PHYS_ MEM DESC; 


sysPhysMemDesc 中 的 值 需要 根据 系统 的 实际 配置 进行 修改 。sysPhysMemDesc 中 定 
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义 的 内 存 地 址 必须 页 对 齐 , 且 必 须 跨越 完整 的 页 。 也 就 是 说 ,PHYS_MEM_DESC 结构 中 
的 前 3 个 域 的 值 必须 能 被 VM_PAGE_SIZE 整除 ,否则 会 导致 VxWorks 初始 化 失败 。 


12.4 设备 管理 与 文件 系统 


12.4.1 I/O 系统 内 部 结构 


嵌入 式 1/O 系统 主要 由 1/O 设备 .相关 设备 驱动 程序 以 及 一 组 标准 的 1/O 操作 函数 组 
成 。 设 备 管理 的 主要 任务 如 下 : 

(1) 选择 和 分 配 1/O 设备 以 便 进 行 数据 传输 操作 。 

(2) 控制 1/O 设备 和 CPU( 或 内 存 ) 之 间 交 换 数据 。 

(3) 为 用 户 提供 友好 的 透明 接口 ,把 用 户 和 设备 特性 分 开 , 使 得 用 户 在 进行 嵌入 式 应 用 
程序 开发 时 不 必 设计 具体 设备 ,由 系统 按 用 户 的 要 求 来 对 设备 的 工作 进行 控制 ,并 需要 为 新 
增 的 用 户 设备 提供 与 系统 核心 相连 接 的 入 口 ,以 便 用 户 开发 新 的 设备 管理 程序 。 

(4) 提高 设备 与 设备 之 间 、CPU 和 设备 之 间 以 及 进程 与 进程 之 间 的 并 行 操作 程度 。 

由 于 用 于 嵌入 式 系统 的 输入 输出 设备 很 多 ,可 从 一 个 简单 的 串 行 通信 设备 到 非常 复杂 
的 无 线 设备 ,各 种 设备 只 具有 单一 功能 ,而 每 个 嵌入 式 系统 
中 集成 的 设备 不 尽 相同 ,因此 ,大 多 数 蔡 入 式 系统 中 将 设备 是 
的 管理 分 为 两 部 分 , 一 部 分 作为 能 入 式 操作 系统 内 核 的 部 。 | 罗 狂 设备 驱动 程序 LDD) 
分 , 另 一 部 分 则 采用 动态 安装 ,在 需要 的 时 候 在 动态 加 载 到 


平台 相关 设备 层 (PDD) 


嵌入 式 系统 中 。 
嵌入 式 操作 系统 支持 设备 管理 的 分 层 结构 ,如 图 12. 12 用 本 生生 证 
所 示 。 硬件 


1/O 系统 的 分 层 结构 中 ,中 断 处 理 程序 是 整个 设备 管 
理 的 基础 。 当 中 断 发 生 时 ,由 中 断 处 理 程序 执行 相应 的 操 
作 并 解除 相应 进程 的 阻塞 态 , 使 其 能 够 继续 执行 ,设备 请 求 队列 中 获得 下 一 个 设备 驱动 请 求 
并 驱动 设备 。 平 台 相 关 设 备 层 (Platform Dependent Device, PDD) 是 底层 实现 与 操作 系统 
的 专用 接口 层 , 而 逻辑 设备 驱动 程序 (Logical Device Driver, LDD) 是 操作 系统 的 专用 接口 
层 , 这 两 层 构成 了 操作 系统 中 的 设备 驱动 程序 。 与 用 户 相关 的 WO 软件 是 上 层 与 用 户 的 接 
口 ,是 执行 适用 于 所 有 设备 的 通用 1/O 功能 ,在 操作 系统 中 定义 了 一 组 标准 的 1/O 操作 区 
数 , 所 有 1/O 设备 驱动 程序 都 支持 这 个 函数 集合 。 

操作 系统 对 设备 的 管理 分 为 3 部 分 : 

(1) 缓冲 技术 ,主要 是 用 于 提高 数据 的 传输 效率 和 安全 ,在 外 围 设备 与 处 理 器 进行 数据 
传输 时 ,通常 将 在 主 存 开辟 缓冲 区 来 暂 存 I/O 数据 ,经 常 采 用 单 缓冲 、 双 缓冲 和 多 缓冲 
技术 。 

(2) 设备 的 调度 ,主要 是 为 等 待 各 设备 的 多 个 进程 安排 使 用 的 顺序 。 对 于 不 同 的 设备 ， 
操作 系统 采用 的 调度 策略 不 尽 相 同 , 但 对 于 大 多 数 设 备 而 言 , 采 用 先 来 先 服 务 是 常见 的 策 
略 ,但 对 于 磁盘 而 言 ,一 般 采 用 寻 道 时 间 最 短 调度 策略 来 提高 磁盘 的 效率 。 另 外 ,设备 调度 
的 功能 可 位 于 操作 系统 的 W/O 管理 模块 ,也 可 以 下 移 到 I/O 处 理 程序 中 。 


图 12.12 IO 系统 的 分 层 结 
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(3) 设备 的 分 配 , 即 在 对 申请 设备 的 进程 进行 设备 分 配 时 采用 的 策略 。 一 般 在 分 配 时 
主要 考虑 分 配 的 完整 性 和 合理 性 ,并 要 考虑 对 设备 的 控制 器 /通道 等 支持 部 件 的 分 配 。 


12.4.2 实时 内 核 的 中 断 管理 


艇 入 式 系统 的 中 断 处 理 是 至 关 重 要 的 ,因为 它 是 以 中 断 方式 通知 系统 外 部 事件 的 发 生 。 
中 断 是 导致 程序 正常 执行 流程 发 生 改变 的 事件 。 在 实际 应 用 中 ,中 断 可 以 分 为 硬件 中 断 、 自 
陷 和 异常 3 种 类 别 。 硬 件 中 断 又 可 分 为 可 屏蔽 中 断 和 不 可 屏蔽 中 断 , 采 用 异步 的 方式 执行 ; 
自 陷 和 异常 通常 为 软件 中 断 ,其 处 理 程序 以 同步 方式 执行 ,处 理 的 方式 与 硬件 中 断 处 理 程序 
类 似 。 

中 断 的 处 理 过 程 分 为 中 断 检测 、 中 断 响应 和 中 断 处 理 3 部 分 。 中 断 检测 在 每 条 指令 结 
东 时 进行 ,用 于 检测 是 否 有 中 断 请 求 或 是 否 满足 异常 条 件 ,因此 ,在 指令 周期 中 ,一 般 采 用 中 
断 周 期 来 满足 中 断 处 理 的 需要 ,在 中 断 周 期 中 ,处 理 器 检查 是 否 有 中 断 发 生 , 若 有 中 断 信号， 
则 进入 中 断 响应 ,对 中 断 进 行 处 理 ; 若 没有 中 断 信号 ,处 理 器 继续 运行 ,并 通过 取 指 令 周 期 提 
取 当 前 程序 的 下 一 条 指令 。 

中 断 响应 是 由 处 理 器 内 部 硬件 完成 的 中 断 序列 ,其 主要 的 工作 是 读 出 中 断 向 量 号 ,将 标 
志 位 寄存 器 压 栈 ,根据 中 断 向 量 号 查找 中 断 向 量 表 ,并 根据 重量 服务 程序 的 首 址 转移 到 中 断 
服务 程序 执行 。 

中 断 处 理 主要 是 执行 中 断 服务 程序 ,一般 中 断 服务 程序 用 于 处 理 自 陷 . 异 常 以 及 硬件 中 
断 , 其 处 理 过 程 主要 分 为 以 下 几 个 方面 : 

(1) 保存 上 下 文 ,保存 中 断 服务 程序 将 要 使 用 的 所 有 寄存 器 的 内 容 , 以 便 退 出 中 断 服务 
程序 之 前 进行 恢复 。 

(2) 车 中 断 向 量 被 多 个 设备 共享 , 则 轮 询 这 些 设备 的 中 断 状态 寄存 器 ,确定 产生 该 中 断 
信号 的 设备 。 

(3) 获取 中 断 相关 的 其 他 信息 。 

(4) 对 中 断 进行 具体 的 处 理 。 

(5) 恢复 保存 的 上 下 文 。 

(6) 执行 中 断 返 回 指令 ,使 CPU 的 控制 返回 到 被 中 断 的 程序 继续 执行 。 

在 实时 系统 中 , 当 对 一 个 中 断 的 处 理 还 没有 完成 ,又 发 生 了 另外 一 个 中 断 时 ,系统 将 采 
用 和 肉 套 的 中 断 处 理 方式 , 先 执行 高 优先 级 中 断 的 中 断 服 务 程序 ,然后 才 执行 被 打 断 的 中 断 服 
务 程 序 ; 而 当 在 中 断 处 理 过 程 中 ,产生 优先 级 比 被 中 断 程 序 更 高 的 进程 时 , 先 执行 优先 级 更 
高 的 进程 ,然后 再 执行 优先 级 低 的 进程 。 

另外 ,在 实时 中 断 处 理 过 程 中 ,由 于 是 内 套 中 断 处 理 ,因此 ,在 系统 中 必须 考虑 为 任务 栈 
预 留 足够 的 空间 ,从 而 使 任务 栈 不 溢出 。 

中 断 服 务 程序 (ISR) 运 行 在 特定 的 空间 ,不 同 于 其 他 任何 任务 ,中 断 处 理 没 有 任务 的 上 
下 文 切 换 。 所 有 的 中 断 服务 程序 都 使 用 同一 中 断 堆 栈 , 它 在 系统 启动 时 就 已 根据 具体 的 配 
置 参数 进行 了 分 配 和 初始 化 。 对 于 ISR 的 基本 约束 就 是 它们 不 能 激活 那些 可 能 使 调用 程 
序 阻塞 的 函数 ,例如 , 它 不 能 获取 信号 量 , 如 果 该 信号 量 不 可 利用 ,内 核 会 试图 让 调用 者 切换 
到 悬 置 态 。 然 而 ,ISR 能 给 出 信号 量 。 

一 个 ISR 通常 与 一 个 或 多 个 任务 进行 通信 ,有 直接 的 也 有 间接 的 ,作为 输入 输出 事务 
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的 一 部 分 。 这 种 通信 的 本 质 是 驱动 任务 执行 ,从 而 处 理 中 断 和 各 种 情况 。 这 与 任务 到 任务 
的 通信 和 同步 基本 相同 ,但 是 有 两 点 不 同 : 
(1) 一 个 ISR 通常 作为 通信 或 同步 的 发 起 者 , 它 通常 返回 一 个 信号 量 , 向 队列 发 送 一 个 
信息 包 或 事件 给 一 个 任务 。ISR 很 少 作为 信息 的 接收 者 , 它 不 可 以 等 待 接收 信息 包 或 事件 。 
(2) ISR 内 的 系统 调用 总 是 立即 返回 ISR 本 身 。 例 如 ,即使 ISR 通过 发 送信 息 包 唤 醒 
了 一 个 很 高 优先 级 的 任务 , 它 也 首先 必须 返回 ISR。 这 是 因为 ISR 必须 先 完成 。 


12.4.3 基本 1/O 操作 流程 


对 于 上 层 用 户 的 I/O 请求, 系统 将 转化 为 具体 的 I/O 要 求 ,控制 设备 完成 1/O 操作 。 
其 基本 的 W/O 操作 流程 主要 分 为 以 下 几 个 步骤 : 

(1) 将 抽象 要 求 转换 为 具体 要 求 , 即 将 I/O 命令 转换 为 控制 器 可 接受 的 命令 格式 。 

(2) 检查 I/O 请 求 的 合法 性 。 

(3) 读 出 和 检查 设备 状态 。 

(4) 传送 必要 的 参数 ,如 传输 字 节 数 、 内 存 地 址 。 

(5) 设置 工作 方式 ,异步 /同步 通信 。 

(6) 启动 IO 设备 ,完成 1/O。 


12.4.4 VxWorks 的 I/O 接口 


VxWorks 中 的 1/O 系统 可 以 提供 简单 、 统 一 、 与 设备 无 关 的 用 户 接 口 ,由 于 VxWorks 
中 的 设备 分 为 字符 设备 、 随 机 存储 块 设备 、 虚 拟 设备 、 控 制 监 视 设备 以 及 网 络 设 备 , 因 此 这 些 
接口 对 于 每 一 种 类 型 的 设备 也 是 不 同 的 。 根 据 操作 方式 的 不 同 ,VxWorks 操作 系统 中 的 I/ 
O 系统 又 分 为 基本 1/O 系统 和 缓冲 I/O 系统 ,操作 系统 为 两 种 不 同 的 I/O 操作 方式 分 别提 
供 了 不 同 的 C 语 言 函数 库 。 基 本 1/O 系统 使 用 了 与 UNIX 标准 相 兼容 的 C 语言 函数 库 , 而 
缓冲 1/O 系统 则 使 用 了 与 ANSIC 标准 相 兼容 的 C 语言 函数 库 。 为 了 获得 更 快 的 速度 和 更 
好 的 兼容 性 ,VxWorks 系统 中 的 W/O 都 是 经 过 优化 设计 的 ,而 速度 和 兼容 性 对 于 VxWorks 
这 样 的 实时 系统 来 说 都 是 至 关 重 要 的 。 

1. 基本 1/O 接口 

基本 I/O 接口 是 VxWorks 中 最 低级 别 的 I/O 接口 。VxWorks 操作 系统 中 的 1/O 操 
作 与 1/O 原 语 相 兼容 ,总 共有 7 种 基本 I/O 操作 可 以 使 用 。 

Create() 创建 并 打开 一 个 新 文件 

Open() 打开 一 个 新 的 或 已 存在 的 文件 

Read() 从 文件 中 读 取 

Write() 向 文件 中 写 人 

IoctlO) 其 他 功能 

Close() 关闭 文件 

Remove() ” 移 除 文件 

2. 缓冲 I/0 接口 

为 了 进一步 对 设备 提供 支持 并 提高 I/O 系统 效率 ,VxWorks 提供 了 对 设备 的 缓冲 操 
作 。 并 且 在 操作 方式 上 与 基本 I/O 操作 非常 类 似 。 

BY 


虽然 VxWorks 为 基本 I/O 系统 提供 了 很 高 的 性 能 ,但 是 每 一 次 的 I/O 访问 仍然 需要 
一 些 与 每 个 底层 函数 调用 相关 的 额外 开销 。 这 些 额外 的 开销 可 能 会 由 两 种 原因 引起 。 其 一 
是 为 了 实现 某 个 操作 ,1/O 系统 首先 调用 与 设备 无 关 的 功能 函数 (比如 说 read() 或 者 是 
write() 等 ) ,然后 再 调用 与 驱动 程序 相关 的 底层 函数 ,这 种 情况 中 虽然 单 次 操作 开销 不 大 ， 
但 是 如 果 频 繁 地 访问 就 要 花 掉 大 量 的 开销 。 其 二 是 大 多 数 的 驱动 程序 都 会 采用 互 斥 或 队列 
的 机 制 来 避免 发 生 因 同时 调用 一 个 驱动 程序 而 导致 多 个 任务 互相 影响 的 情况 ,这 就 会 使 系 
统 频繁 地 将 任务 在 各 种 状态 之 间 切 换 , 从 而 消耗 掉 了 系统 资源 。 

在 实际 中 , 单 次 执行 这 些 操 作 所 使 用 的 开销 是 很 小 的 。 但 是 如 果 频 繁 地 访问 设备 ,例如 
每 读 取 一 个 字 节 都 使 用 一 次 read() ,就 会 给 系统 带 来 较 大 的 开销 ,如 下 所 示 : 


n=readl( fd, &char, 1); 


为 了 使 上 面 例子 的 IO 操作 更 有 效 、 更 灵活 ,VxWorks 提供 了 缓冲 机 制 , 对 大 量 可 以 组 
冲 的 数据 进行 W/O 读 写 操作 。 而 这 种 缓冲 对 于 用 户 是 透明 的 。 用 户 如 果 和 希望 使 用 缓冲 操 
作 , 只 需要 将 文件 用 fopen() 函 数 以 缓冲 的 方式 打开 就 可 以 实现 了 。 下 面 给 出 一 个 以 缓冲 
方式 打开 文件 的 例子 : 


fp=fopen("/disk/myfilel" , "r"); 


fopen() 函 数 所 返回 的 是 一 个 文件 指针 , 它 指 向 的 结构 包含 已 经 打开 的 文件 描述 符 、 文 
件 对 应 的 缓冲 区 以 及 缓冲 区 的 句柄 。 这 个 文件 指针 实际 上 是 指向 FILE 类 型 的 数据 结构 指 
针 。 基 本 1/O 操作 函数 是 通过 文件 描述 符 来 确认 一 个 文件 ,文件 描述 符 是 一 个 整 型 数 ;而 
缓冲 1/O 操作 则 是 一 个 指向 结构 的 指针 ,在 这 个 指针 里 面包 含 相应 文件 的 文件 描述 符 。 

3. 其 他 1/O 接口 

VxWorks 还 提供 了 其 他 的 一 些 格式 化 的 I/O 操作 ,包括 printf()、sprintf()、sscanf()、 
printer() fdprintf() 和 信息 记录 函数 logMsg()。 这 些 函 数 都 是 常用 的 格式 化 输入 输出 函 
数 ,符合 ANSIC 标准 。 

在 其 他 常用 的 系统 中 printf() 、sprintf() 和 sscanf() 三 个 函数 作为 标准 的 stdio 库 中 的 
一 部 分 。 但 在 VxWorks 中 却 包 含 在 fioLib 函数 库 中 。 所 以 在 使 用 这 三 个 函数 的 时 候 可 以 
不 包含 stdio 库 。 昌 然 这 些 函 数 支 持 ANSI 标准 指定 的 功能 ,但 printf() 却 不 是 一 个 缓冲 型 
的 函数 。 如 果 和 希望 执行 带 有 缓冲 功能 的 printf() 类 型 的 输入 输出 函数 ,可 以 在 应 用 程序 中 
使 用 fprintf() 来 代替 printf() 。 

VxWorks 在 fioLib 库 中 另外 还 提供 了 两 种 具有 格式 化 操作 但 非 缓 冲 类 型 的 输出 函数 。 
printErr() 函 数 在 功能 上 与 printf() 相 似 , 不 同 的 是 。printErr() 将 格式 化 的 字符 串 输入 到 
标准 错误 输出 设备 ,fdprintf() 也 提供 类 似 的 功能 , 它 可 以 将 格式 化 的 字符 串 输出 到 任意 文 
件 中 。 

为 了 方便 调试 信息 的 输出 以 及 在 终端 程序 中 输出 调试 信息 ,VxWorks 还 提供 在 没有 任 
务 上 下 文 或 不 对 任务 上 下 文 进行 /O 操作 的 情况 下 记录 格式 化 信息 的 方式 。 信 息 的 格式 
和 参数 将 通过 消息 队列 传递 到 执行 记录 的 任务 中 ,然后 这 个 任务 将 信息 格式 化 并 输出 。 


12.4.5 文件 系统 架构 及 操作 


嵌入 式 操作 系统 中 的 文件 管理 和 通用 的 操作 系统 中 的 文件 管理 有 所 不 同 , 其 主要 提供 
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文件 存储 、 检 索 和 更 新 等 功能 ,但 一 般 不 提供 保护 和 加 密 等 安全 机 制 。 在 某 些 情况 下 ,文件 
系统 还 可 以 针对 特殊 的 目的 来 进行 定制 ,特别 是 随 着 特定 
应 用 的 舱 入 式 操作 系统 的 发 展 ,文件 系统 的 功能 规整 性 、 可 
伸缩 性 及 其 灵活 性 得 到 了 很 大 的 提高 。 文件 系统 层 

整个 文件 系统 的 架构 如 图 12. 13 所 示 , 自 上 而 下 包括 
API 接 口 层 .文件 系统 层 . 中 间 件 层 和 物理 驱动 展 。API 接 
口 层 是 与 用 户 的 接口 ,通过 API 接口 层 为 访问 多 个 文件 系 
统 提供 一 个 统一 的 抽象 接口 ;文件 系统 层 用 于 实现 文件 系 硬件 (磁盘 、 闪 存 等 ) 
统 的 初始 化 工作 和 与 下 层 的 格式 化 接口 ,是 具体 文件 系统 
的 操作 接口 及 其 他 文件 系统 的 可 扩展 接口 ;中 间 件 层 主要 
实现 对 存储 设备 的 管理 ,包括 向 上 的 文件 系统 层 接口 、 地 址 转换 和 物理 设备 驱动 接口 等 功 
能 ;驱动 层 主要 实现 对 不 同 存储 介质 的 基本 访问 驱动 接口 ,所 有 的 嵌入 式 存储 设备 提供 的 接 
口 在 中 间 件 层 会 进行 封装 ,以 实现 具体 设备 之 间 的 统一 访问 。 

文件 系统 的 操作 包括 对 文件 的 操作 和 对 目录 的 操作 ,所 有 的 操作 以 系统 调用 和 命令 方 
式 提供 ,具体 操作 如 下 : 

(1) 设置 修改 对 文件 和 目录 的 存 取 权限 。 

(2) 建立 ,修改 .改变 和 删除 目录 等 服务 。 

(3) 创建 .打开 、 读 写 、 关 闭 和 撤销 文件 等 服务 。 

内 入 式 系 统 的 文件 系统 通常 支持 几 种 标准 的 文件 系统 ,如 FAT32、JFFS2 和 YAFFS 
等 。 除 支持 标准 的 文件 系统 外 ,为 提高 实时 性 ,有 些 租 入 式 文件 系统 还 支持 自 定 义 的 实时 文 
件 系统 ,这 些 文件 系统 一 般 采 用 连续 的 方式 存储 文件 。 在 谋 入 式 系统 中 ,由 于 存储 介质 的 不 
同 ,文件 系统 也 有 所 不 同 ,因此 ,一 般 蔡 入 式 系统 的 文件 系统 是 可 裁剪 .可 配置 的 。 可 以 根据 
人 能 入 式 系统 的 要 求 选择 所 需 的 文件 系统 ,选择 所 需 的 存储 介质 ,配置 可 同时 打开 的 最 大 文件 
数 等 ;同时 ,考虑 到 存储 设备 的 多 样 性 及 各 种 存储 设备 的 不 同 特点 ,在 设计 髋 入 式 文件 系统 
时 ,还 需 能 方便 地 挂 接 不 同 存储 设备 的 驱动 程序 ,具有 灵活 的 设备 管理 能 力 ; 并 需 考 虑 外 部 
存储 设备 的 性 能 、 寿 命 等 因素 ,发 挥 不 同 外 存 的 优势 ,提高 存储 设备 的 可 靠 性 和 使 用 寿命 。 


API 接 口 层 


中 间 件 层 
物理 驱动 层 


图 12.13 文件 系统 的 分 层 结构 


12.4.6 VxWorks 文件 系统 


VxWorks 提供 对 字符 设备 和 块 设备 的 访问 ,其 快速 文件 系统 适合 实时 系统 应 用 。 它 包 
括 几 种 支持 使 用 块 设备 (如 磁盘 ) 的 本 地 文件 系统 。 这 些 设备 都 使 用 一 个 标准 的 接口 ,从 而 
使 得 文件 系统 能 够 被 灵活 地 在 设备 驱动 程序 上 移植 。 

VxWorks 也 支持 SCSI 磁带 设备 的 本 地 文件 系统 。VxWorks I/O 体系 结构 甚至 还 支 
持 在 一 个 单独 的 VxWorks 系统 上 同时 并 存 几 个 不 同 的 文件 系统 。 

VxWorks 支持 4 种 文件 系统 ,分 别 是 dosFs、rtllFs、rawFs 和 tapeFs。 

(1) dosFs: 适用 于 块 存 取 设备 (磁盘 ) 的 实时 操作 ,是 与 MS-DOS 文件 系统 兼容 的 文件 
系统 。 

(2) rtllFs: 提供 了 一 种 简单 的 原始 文件 系统 。 该 文件 系统 将 整个 磁盘 当 作 一 个 单独 
的 大 文件 。 

(3) rawFs: 适用 于 不 使 用 标准 文件 或 目录 结构 的 磁带 设备 。 实 际 上 将 磁带 盘 当 作 一 
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个 原始 设备 并 将 整个 磁带 盘 当 作 一 个 大 文件 。 

(4) tapeFs: 允许 应 用 程序 从 按照 ISO 9660 标准 文件 系统 格式 化 的 CD-ROM 设备 上 
读 取 数 据 。 

(5) TrueFFS: 简称 TFFS, 是 为 各 种 Flash 存储 器 提供 通用 的 块 设备 接口 ,支持 NOR 
和 NAND 的 Flash 存储 器 。 该 文件 系统 将 Flash 存储 器 映射 为 一 系列 连续 的 块 ,并 使 用 
block-to-flash 转换 系统 ,方便 地 将 块 编号 直接 转换 为 flash 地 址 。 

男 一 方面 ,普通 数据 文件 和 外 部 设备 都 统一 作为 文件 处 理 。 它 们 在 用 户 面 前 有 相同 的 
语法 定义 ,使 用 相同 的 保护 机 制 ,这 样 既 简 化 了 系统 设计 ,又 便于 用 户 使 用 。 

VxWorks 中 用 户 读 写 文件 的 接口 是 标准 接口 ,处 于 最 上 层 的 应 用 对 文件 系统 的 操作 接 
口 包括 ioLib ,ansiStdio ,fioLib、dirLib 以 及 usrFsLib。 

ioLib 提供 的 是 对 文件 读 写 的 标准 接口 ,包括 fopen()、fclose()、fread()、fwrite() 及 
fseek() 等 ,在 ioLib 中 还 提供 一 些 与 文件 系统 相关 的 特殊 接口 ,如 unlink()、rename()、 
lseek() .chdir() 和 getwd() 等 。 

dirLib 库 提供 的 是 目录 文件 列表 读 取 的 功能 , 它 建 立 在 ioLib 之 上 ,包括 打开 目录 
(opendir) . 读 取 目录 (readdir)、 使 目录 读 取 位 置 从 头 开始 (rewinddir) 以 及 关闭 目录 
(closedir) 等 操作 ,dirLib 还 提供 用 于 获取 文件 或 文件 系统 状态 信息 的 函数 接口 ,如 fstat、 
stat 和 fstatfs 等 。 

usrFsLib 是 在 ioLib 和 dirLib 之 上 的 更 实用 的 抽象 , 提供 给 用 户 熟 悉 的 命令 , 如 
ioHelp cd、pwd、mkdir、rmdir、rm、chkdsk 、 ls、11、lsr、1llr、copy、cp、rename、mv、xcopy、 
xdelete vattrib 、xattrib 和 diskFormat 等 。 


12.5 坐 和 人 式 操作 系统 的 开发 


当前 , 随 着 嵌入 式 软件 的 发 展 , 越 来 越 多 功能 强大 的 岩 入 式 操作 系统 也 相继 涌现 ,这 些 
操作 系统 所 采用 的 体系 结构 以 及 技术 手段 各 有 特色 ,在 开发 中 具有 以 下 方面 的 考虑 。 
1. 主机 /目标 机 的 体系 结构 
许多 艇 人 式 操 作 系统 在 开发 过 程 中 都 采取 了 主机 /目标 机 的 设计 方法 。 主 机 /目标 机 的 
体系 结构 是 将 开发 工具 放 在 主机 上 ,目标 机 上 则 放 操 作 系 统 的 核心 模块 ,操作 系统 支持 跟踪 
调试 。 如 此 , 设计 者 便 可 在 目标 机 上 运行 操作 系统 及 应 用 软件 ,而 开发 和 调试 则 通过 主机 
进行 ,使 开发 的 过 程 变 得 相对 简单 。 
2. 划分 模块 
帜 入 式 系统 在 许多 领域 都 有 应 用 ,不 同 的 应 用 目的 拥有 不 同 的 功能 和 结构 ,从 而 租 入 式 
操作 系统 也 不 同 。 因 此 ,在 设计 嵌入 式 操作 系统 时 ,充分 考虑 系统 的 功能 与 结构 的 划分 ,这 
可 增加 嵌入 式 系统 操作 的 适用 性 及 灵活 性 。 因 此 ,在 进行 操作 系统 开发 时 ,划分 核心 模块 ， 
将 一 些 系统 的 核心 功能 独立 出 来 ,形成 单独 的 可 拆卸 的 模块 ,对 于 增强 操作 系统 的 模块 性 具 
有 很 大 的 意义 ,而 且 也 成 为 租 入 式 操 作 系 统 发 展 的 一 个 总 趋势 。 
3. 充分 利用 现 有 资源 
虽然 当今 软件 技术 已 高 度 发 达 , 但 从 头 设 计 一 个 操作 系统 也 需要 较 长 的 时 间 ,因此 为 
减少 操作 系统 开发 的 工作 量 , 可 充分 利用 现 有 的 资源 进行 设计 。 
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4. 制定 API 标准 

为 实现 嵌入 式 操 作 系 统 的 透明 性 以 及 无 关 性 ,方便 用 户 的 使 用 ,就 需要 给 用 户 提 供 标准 
以 及 实用 的 应 用 程序 接口 (API)。 通 过 以 上 方式 便 可 实现 家 入 式 操作 系统 。 另 外 ,在 设计 
由 入 式 操作 系统 时 还 需 遵 循 以 下 原则 : 充分 利用 相关 的 计算 机 技术 使 得 所 设计 的 操作 系统 
有 具 有 和 较 高 的 性 价 比 ;要 考虑 到 操作 系统 与 舱 入 式 系统 的 匹配 性 ;在 满足 垦 入 系统 功能 的 同时 
要 尽 可 能 简单 ,从 而 节约 系统 开销 费用 。 

目前 ,能 入 式 操 作 系 统 的 开发 一 般 和 肉 入 式 软件 的 开发 一 起 进行 ,需要 一 个 交叉 编译 和 
调试 环境 , 即 编辑 和 编译 软件 在 主机 上 进行 (如 在 PC 的 Windows 操作 系统 下 ) ,编译 好 的 
软件 需要 下 载 到 目标 机 上 运行 (如 在 一 个 PC 目标 机 上 的 VxWorks 操作 系统 下 ) ,主机 和 和 目 
标 机 建立 起 通信 连接 ,并 传输 调试 命令 和 数据 。 由 于 主机 和 目标 机 往往 运行 着 不 同 的 操作 
系统 ,而 且 处 理 器 的 体系 结构 也 彼此 不 同 ,这 就 增加 了 和 能 入 式 开发 的 复杂 性 。 


12.5.1 集成 开发 环境 Tornado 


Tornado 是 嵌入 式 实时 领域 里 最 新 一 代 的 开发 调试 环境 , 它 给 能 入 式 系 统 开 发 人 员 提 
供 了 一 个 不 受 目 标 机 资源 限制 的 超级 开发 和 调试 环境 ,是 为 开发 嵌 和 人 式 操 作 系统 
(VxWorks) 及 其 应 用 系统 所 提供 的 集成 开发 环境 ,Tornado J[ 中 包含 的 工程 管理 软件 可 以 
将 用 户 自 己 的 代码 与 VxWorks 的 核心 有 效 地 组 合 起 来 ,可 以 按 用 户 的 需要 裁剪 配置 
VxWorks 内 核 ;VxSim 原型 仿真 器 可 以 让 程序 员 在 不 用 目标 机 的 情况 下 直接 开发 系统 原 
型 ,作出 系统 评估 ;功能 强大 的 CrossWind 调试 器 可 以 提供 任务 级 和 系统 级 的 调试 模式 ,可 
以 进行 多 目标 机 的 联 调 ;优化 分 析 工 具 可 以 帮助 程序 员 从 多 种 方式 真正 地 观察 .跟踪 系统 的 
运行 ,排除 错误 ,优化 性 能 。Tornado 的 整体 结构 如 图 12. 14 所 示 ,其 包含 3 个 高 度 集成 的 
部 分 : 

(1) 运行 在 主机 和 目标 机 上 的 强 有 力 的 交叉 开发 工具 和 实用 程序 。 

(2) 运行 在 目标 机 上 的 高 性 能 、 可 裁剪 的 实时 操作 系统 VxWorks。 

(3) 连接 主机 和 目标 机 的 多 种 通信 方式 ,如 以 太 网 .串口 线 .ICE 或 ROM 仿真 器 等 。 

对 于 不 同 的 目标 机 ,Tornado 给 开发 者 提供 一 个 一 致 的 图 形 接口 和 人 机 界面 。 当 使 用 
Tornado 的 开发 人 员 转 向 新 的 目标 机 时 ,不 必 再 花费 时 间 学 习 或 适应 新 的 工具 ;对 和 能 入 式 应 
用 开发 者 来 说 更 重要 的 是 ,Tornado 所 有 的 工具 都 是 驻 留 在 开发 平台 上 的 。 在 府 人 式 系统 
工具 发 展 历史 上 ,Tornado 是 第 一 个 实现 了 当 目 标 机 资源 有 限时 开发 工具 仍 可 使 用 而 且 功 
能 齐全 的 开发 环境 。 另 外 ,所 有 工具 都 通过 一 个 中 央 服 务 器 (target server) 处 理 与 目标 机 的 
通信 。 所 以 无 论 连接 方式 是 Ethernet 还 是 串口 线 ICE 仿真 器 ,ROM 仿真 器 或 客户 设计 的 
调试 通道 ,所 有 工具 均 可 使 用 。 

Tornado 开 和 伦 入 式 开发 系统 的 软件 工具 包含 了 核心 工具 (Core tools) 和 备 选 工具 
(Optional tools) 两 部 分 。 

1. 核心 工具 (Core tools) 

核心 工具 安装 简单 ,通过 紧密 集成 的 开发 环境 可 以 在 应 用 程序 开发 的 任何 阶段 轻松 地 
访问 ,而 且 不 必 关 心目 标 系统 的 连接 方式 或 目标 系统 的 内 存 大 小 。 

。 图 形 化 的 交叉 调试 器 (Debugger)CrossWind/WDB: 远程 的 源 代码 集成 调试 器 , 支 

持 任务 级 和 系统 级 调试 ,支持 混合 源 代 码 和 汇编 代码 显示 ,支持 多 目标 机 同时 调试 。 
a 


Sun 
HP 


Windows 
95 


Windows 
T 


N 


IBM 


PowerPC 


68K 


Launcher 


x86 
POSIX Library 
SH 
Core OS 
ARM 


MIPS 


i960Rx 


| 2 ls 
Debug Agent 
Simulation Environment 


VxSim 


965xx 


图 12. 14 Tornado 整体 结构 示意 图 


开发 者 可 以 在 目标 运行 系统 上 产生 和 调试 任务 ,也 可 以 将 调试 器 和 已 经 运行 的 任务 
连接 在 一 起 ,这 些 任务 可 以 是 来 自 应 用 程序 ,也 可 以 是 来 自任 务 级 调试 环境 ,具有 很 
强 的 灵活 性 。 

工程 配置 工具 (Project Facility/Configuration): 强 有 力 的 图 形 化 工具 ,提供 对 
VxWorks 操作 系统 及 其 组 件 进行 自动 配置 的 功能 ,可 自动 进行 依赖 性 分 析 、 代 码 容 
量 计算 .自动 裁剪 wizard 以 及 自动 生成 维护 Makefile, 单 独 的 组 件 可 以 独立 开发 ,并 
可 以 共享 和 重用 。 

集成 仿真 器 (Integrated Simulator) : 即 VxSim 仿真 器 ,支持 CrossWind、WindView 
和 Browser, 提 供与 真实 目标 机 一 致 的 调试 和 仿真 运行 环境 。VxSim 仿真 器 包含 在 
各 个 软件 包 中 ,允许 开发 者 可 以 在 没有 BSP .操作 系统 配置 和 目标 机 硬件 的 情况 下 ， 
使 用 Tornado 开 迅速 开始 开发 工作 。 

诊断 分 析 工 具 (WindView for the Integrated Simulator) : 图 形 化 的 动态 诊断 和 分 析 
工具 ,主要 是 向 开发 者 提供 目标 机 硬件 上 实际 运行 的 应 用 程序 的 许多 的 详细 情况 ， 
可 图 形 化 显示 任务 、 中 断 和 系统 对 象 相互 作用 的 复杂 关系 ,并 可 以 选择 用 于 监视 目 
标 人 硬件 系统 行为 的 WindView。 

C/C++ 编译 环境 (C/C++ Compilation Environment): 包含 了 交叉 编译 器 、 
iostreams 类 库 和 一 些 列 的 工具 ,用 于 支持 C 语言 和 C++ 语言 编程 。 交 又 编译 器 包 
括 Diab C/C++ Compiler.GNU C/C++ Compiler 等 ;iostreams 类 库 支 持 C++ 中 的 
格式 化 的 和 类 型 安全 的 I/O ,可 扩展 到 用 户 自 定 义 数 据 类 型 ,支持 C++ 应 用 程序 开 
发 的 工业 标准 。 另 外 ,Tornado 工 还 提供 对 C++ 全面 的 支持 ,包括 异常 事件 处 理 、 标 
准 模 板 库 (Standard Template Library, STL)、 运 行 类 型 识别 (Run-Time Type 
Identification,RTTI) .支持 静态 构造 器 和 析 构 器 的 加 载 器 以 及 C++ 调试 器 ,从 而 保 
证 工具 与 开发 环境 紧密 地 结合 在 一 起 。 

主机 目标 机 连接 配置 器 (Launcher): Launcher 允许 开发 者 轻松 地 设置 和 配置 一 定 
的 开发 环境 ,并 提供 对 开发 环境 的 管理 和 许多 管理 功能 。 
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目标 机 系统 状态 浏览 器 (Browser) : 是 Tornado 上 shell 的 一 个 图 形 化 组 件 , 其 主 窗 
口 提 供 目 标 系统 的 全 面 状态 总 结 , 允许 开发 者 监视 独立 的 目标 系统 对 象 : 任务 、 信 
号 灯 、 消 息 队 列 、 内 存 分 区 、 定 时 器 ,模块 、 变 量 , 堆 栈 等 。 这 些 显示 可 根据 开发 者 的 
选择 进行 周期 性 或 条 件 性 更 新 。 


命令 行 执行 工具 (WindSh): 是 Tornado [[ 所 独 有 | aes 强大 的 命令 行 解释 器 ,可 以 


直接 解释 执行 C 语言 表达 式 ,调用 目标 机 上 的 C 语言 函数 ,访问 系统 符号 表 中 登记 
的 变量 ,还 可 以 直接 执行 TCL 语言 。 

多 语言 浏览 器 (WindNavigator): 用 于 提供 源 程序 代码 浏览 ,图 形 化 显示 函数 调用 
关系 ,快速 代码 定位 。 

图 形 化 核心 配置 工具 (WindConfig) : Tornado[[ 的 图 形 化 核心 配置 工具 (WindConfig) 使 
用 图 形 向 导 方 式 智能 化 地 自动 配置 VxWorks 内 核 及 其 组 件 参 数 。 

增 量 加 载 器 (Incremental Loader): Tornado 了 的 增 量 加 载 器 (Incremental Loader) 
可 以 动态 地 加 载 新 增 模 块 并 在 目标 机 与 内 核实 现 动态 链接 运行 ,不 必 重 新 下 载 内 核 
及 未 改动 的 模块 ,加 快 开发 速度 。 

备 选 工具 (Optional tools) 


备 选 工具 包含 以 下 项 目 : 


软件 逻辑 分 析 仪 WindView: 为 开发 者 专门 设计 的 符合 实时 授 入 式 系 统 开发 要 求 的 
高 级 的 可 视 化 工具 。 通 过 软件 逻辑 分 析 仪 ,开发 者 能 看 见 舱 入 式 系 统 内 部 的 动态 
行 过 程 ,能 以 微 秒 级 时 间 精 度 显 示 任 务 、 中 断 服 务 程序 和 系统 对 象 之 间 的 复杂 的 相 
互 关 系 ,从 而 能 让 开发 者 迅速 找到 关键 问题 所 在 而 忽略 次 要 问题 ,理解 特殊 行为 产 
生 的 原因 ,并 找到 解决 问题 的 最 佳 方案 。 
原型 仿真 器 VxSim: 是 一 个 完整 的 原型 和 仿真 工具 , 它 可 以 帮助 开发 者 在 没有 实际 
的 目标 硬件 的 前 提 下 ,先进 行 包括 网 络 和 基于 多 处 理 器 的 VxWorks 应 用 程序 设计 
和 调试 ;同时 , 它 还 允许 开发 者 在 开发 周期 的 前 期 就 进行 大 量 的 应 用 程序 测试 ,以 降 
低 更 改 软件 的 成 本 。 
显示 软件 包 ScopePak: 实时 图 形 检 测 和 数据 收集 工具 ,包括 软件 示波器 
StethoScope 和 跟踪 示波器 TraceScope 两 个 工具 。 它 允许 开发 者 在 应 用 程序 运行 
时 监视 数据 和 郴 数 调用 ( 白 盒 监测 工具 ) ,观察 系统 中 任何 一 组 变量 和 内 存 的 分 配 情 
况 ,发 现 可 能 被 忽视 的 峰值 和 失灵 ,观察 建立 在 特定 事件 上 的 触发 集合 ;可 以 在 程序 
运行 时 改变 变量 的 值 并 将 数据 存盘 ;还 可 以 看 见 代 码 改 变 、 es ret 
影响 。 显 示 软 件 包 ScopePak 是 一 个 可 以 深入 到 应 用 程序 内 部 的 有 价值 的 诊 
具 , 可 提供 程序 的 鲜 活 的 分 析 报 告 而 不 影响 实时 性 。 
性 能 检测 包 PerformancePak: 是 黑 盒 监测 工具 ,包含 CPU 运行 分 析 工 具 
ProfileScope 和 内 存 使 用 分 析 工 具 MemScope, 不 需要 特殊 的 编译 ,可 以 提供 CPU 
工作 图 和 应 用 程序 使 用 内 存 情况 的 详细 分 析 图 ,可 以 指出 系统 缺乏 效率 的 地 方 或 需 
要 开发 者 调整 的 地 方 ,还 可 提供 可 视 化 工具 在 系统 失败 前 控制 内 存 使 用 ,从 而 使 开 
发 的 操作 系统 和 应 用 程序 获得 最 好 的 性 能 。 
代码 测试 器 CodeTest: 是 白 盒 测试 工具 ,包括 Converge Module 和 Memory Module 
两 部 分 。Converage Module 主要 是 确定 代码 中 未 经 测试 的 部 分 和 提供 系统 的 动态 
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视图 ,Memory Module 主要 是 显示 内 存 的 动态 分 配 情况 ,检查 内 存 的 泄漏 。 该 工 
的 应 用 能 让 开发 者 获得 最 精确 的 测量 ,发 现 最 难 解决 的 跟踪 动态 内 存 分 配 问题 。 


12.5.2 VxWorks 的 交叉 编译 开发 环境 


整个 VxWorks 操作 系统 的 基本 构成 部 件 主要 包括 板 级 支持 包 BSP(Board Support 
Package) , 微 内 核 wind 进程 管理 .存储 管理 .设备 管理 .文件 系统 管理 .网络 协议 及 系统 应 
用 等 几 个 部 分 ,VxWorks 只 占用 了 很 小 的 存储 空间 ,并 可 高 度 裁 剪 ,保证 了 系统 能 以 较 高 的 
效率 运行 。 在 Tornado 开 系 统 中 ,为 支持 WxWorks 操作 系统 的 开发 ,同样 也 提供 了 
VxWorks 运行 组 件 , 包 括 板 级 支持 包 开 发 工具 BSP Developer's Kit 支持 松散 耦合 分 布 式 
多 处 理 器 的 VxFusion、WindML &. Zinc for VxWorks 图 形 界面 开发 包 、Java 虚拟 机 以 及 
TrueFFS Flash 文件 系统 等 几 个 部 分 。 

1. 板 级 支持 包 开 发 工具 BSP Developer’s Kit 

板 级 支持 包 开 发 工具 BSP Developer s Kit 为 租 入 式 软 件 工 程 师 开发 自己 的 目标 硬件 
的 驱动 程序 ,进而 开发 BSP 方面 提供 了 强 有 力 的 支持 。 板 级 支持 包 开 发 工具 包括 板 级 支持 
包 开 发 工具 基本 包 BSP Developer's Kit Base Option 和 板 级 支持 包 开 发 工具 高 级 包 BSP 
Developer s Kit Value Option 。 

(1) 板 级 支持 包 开 发 工具 基本 包 BSP Developer's Kit Base Option 主要 面向 的 是 并 不 
绝对 需要 驱动 程序 代码 样本 的 敌人 式 开 发 者 ,其 主要 组 成 包括 以 下 几 部 分 ， 

板 级 支持 包 测 试 工具 BSP validation test suite: 用 来 检查 BSP 和 驱动 程序 的 基本 功 
能 以 及 报告 存在 的 问题 。 采 用 源 代码 形式 呈现 ,可 以 运行 在 Windows 95/98/NT、 
Solaris、SunOS 和 HP-UX 等 操作 系统 的 主机 上 。 

板 级 支持 包 开 发 模板 Template BSP: 针对 各 种 CPU( 如 Motorola 68K/CPU32、 
Intel/ AMD/Cyrixx86、 MIPS、 Morotorola/IBM PowerPC、 SPARC 和 Intel 1960 
等 ) ,提供 BSP 开发 的 起 点 。 

驱动 程序 开发 模板 Template Driver: 用 于 提供 各 种 设备 的 驱动 程序 模板 ,包括 串口 
(Serial) .以 太 网 (Ethernet)、SCSI\ 中 断 控制 器 (Interrupt Controller)\VME .定时 
器 (Timer) 以 及 Non-volatile RAM 等 。 

SCSI 测试 工具 SCSI Test Suite: 用 于 SCSI 的 测试 。 

板 级 支持 包 开 发 工具 文档 Documentation Set: 描述 板 级 支持 包 开 发 工具 的 帮助 说 
明文 档 。 

(2) 板 级 支持 包 开 发 工具 高 级 包 BSP Developer's Kit Value Option 主要 面向 的 是 愿意 
使 用 WindRiver 公司 提供 的 一 般 驱 动 程序 源 代 码 作为 他 们 自己 的 驱动 程序 和 BSP 开发 起 
点 的 开发 者 。 板 级 支持 包 开 发 工具 高 级 包 BSP Developer's Kit Value Option 包括 几乎 所 
有 现成 的 标准 驱动 程序 ,例如 Ethernet、SCSI 等 驱动 程序 源 代 码 。 其 主要 组 成 包括 以 下 几 
部 分 : 

。 板 级 支持 包 开 发 工具 基本 包 BSP Developer's Kit Base Option 。 

。 Ethernet 驱动 程序 源 代码 Ethernet Driver Source。 

。 SCSI 驱动 程序 源 代 码 SCSI Driver Source。 
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2. 支持 松散 耦合 分 布 式 多 处 理 器 的 VxFusion 

VxFusion 是 一 个 轻便 的 、 独 立 于 媒体 的 容错 机 制 , 这 种 机 制 建立 在 VxWorks 的 消息 
队列 基础 之 上 ,主要 用 来 开发 分 布 式 应 用 程序 。 

VxFusion 具有 以 下 特点 : 

(1) 提供 一 个 轻便 的 基于 VxWorks 消息 队列 的 分 布 式 机 制 。 

(2) 本 身 独 立 于 媒体 ,允许 分 布 式 系统 无 论 以 什么 传输 方式 都 可 以 实现 有 效 的 数据 交 
换 ,而 且 用 户 不 需要 通信 硬件 。 

(3) 通过 在 多 节点 系统 中 复制 每 个 节点 上 已 知 对 象 的 数据 库 来 保证 没有 一 对 多 的 主 从 
依赖 关系 所 引起 的 每 个 单 点 的 失效 。 

(4) 支持 系统 中 点 对 点 和 广播 方式 的 消息 传递 。 

(5) 支持 地 点 的 透明 性 。 即 对 象 不 用 重 写 应 用 程序 代码 就 可 以 实现 在 系统 中 无 颖 的 移 
动 。 尤 其 特别 的 是 ,在 多 节点 系统 中 不 管 对 象 的 位 置 就 可 以 实现 向 对 象 传递 消息 。 

3. WindML & Zinc for VxWorks 图 形 界面 开发 包 

WindML &. Zinc for VxWorks 可 以 使 开发 者 在 VxWorks 实时 操作 系统 上 以 较 低 的 系 
统 开 销 设计 实现 丰富 多 彩 的 人 能 入 式 GUI。 其 只 需要 很 小 的 内 存 就 能 获得 高 性 能 的 图 形 输 
出 ,并 容易 移植 ,可 裁剪 ,高度 可 定制 ,具有 丰富 的 用 户 界面 对 象 ,支持 单字 节 和 双 字 节 集 以 
及 通用 的 多 媒体 图 形 库 , 从 而 使 其 开发 更 丰富 多 彩 。 

4. Java 虚拟 机 

Java 虚拟 机 主要 是 Personal Java for VxWorks, 它 能 完全 兼容 Personal Java, 提供 完整 
的 基于 Java 线程 的 控制 ,并 能 使 VxWorks 任务 和 Java 线程 共同 运行 ,相互 同步 ,相互 通 
信 ,具有 设计 一 次 就 可 以 在 任何 地 方 运行 .面向 Internet、` 安 全 性 .可 扩展 性 、. 可 升级 性 、 可 裁 
剪 性 和 可 移植 性 等 特点 。 

对 于 Internet Intranet 和 消费 电子 的 应 用 程序 来 说 ,Personal Java for VxWorks 与 其 
他 的 WindRiver 解决 方案 实现 了 无 颖 集成 ,其 中 包括 WindNet 网 络 产品 。 

5. TrueFFS Flash 文件 系统 

TrueFFS Flash 是 Tornado 开 开 发 环境 中 集成 的 快速 闪存 文件 系统 , 它 使 用 一 系列 艇 
入 式 闪 存 设备 来 实现 快速 可 靠 的 物理 存储 。 在 系统 中 采用 仿真 VxWorks DOS 文件 系统 下 
的 人 硬盘 驱动 器 ,开发 者 可 以 使 用 标准 的 文件 系统 界面 来 产生 和 操作 一 个 文件 系统 ,从 而 使 办 
存 设备 上 的 读 写 操作 与 在 DOS 文件 系统 设备 上 一 样 。 

在 实时 应 用 系统 的 开发 调试 阶段 ,往往 以 PC 作为 主机 来 调试 程序 。 一 般 在 Tornado 
了 环境 中 ,具体 的 软件 调试 环境 搭建 可 以 采用 以 下 方法 : 

(1) ICE 方 法。 仿真 头 插 在 用 户 板 的 CPU 上 ,image 在 仿真 器 中 运行 ,由 仿真 器 的 
CPU 在 用 户 的 硬件 环境 下 运行 来 调试 软件 。 其 缺点 是 性 价 比 不 高 。 

(2) BDM 方式 。 主 机 通过 并 口 连接 的 Adapter 连接 到 CPU 的 BDM 接口 上 ,用 户 板 上 
的 CPU 支持 一 种 断 点 逻辑 ,通过 这 种 硬件 调试 代理 ,进行 image 的 调试 。 其 缺点 是 CPU 必 
须 支持 BDM 方式 。 

(3) 串口 调试 方法 。 主 机 和 目标 机 用 串口 线 连接 ,在 主机 和 目标 机 之 间 提 供 一 种 无 颖 

连接 。 目 标 机 需要 使 用 VxWorks 支持 的 网 卡 ,image 通过 以 太 网 由 主机 下 载 到 目标 机 。 由 
于 VxWorks 支持 的 网 卡 比 较 常 见 , 并 且 网 络 调试 的 速度 很 快 , 且 支 持 网 络 功能 , 故 网 络 连 
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接 成 为 常用 方法 。 
一 般 开 发 时 常用 后 两 种 方法 建立 调试 环境 ,具体 方法 由 config. h 中 的 BOOT_LINE 
决定 。 


12.5.3 实例 开发 的 设计 与 实现 过 程 


使 用 Tornado 环境 进行 开发 时 ,VxWorks 系统 可 以 为 用 户 提供 大 量 的 系统 调用 接口 ， 
针对 开发 工作 和 实时 系统 的 特点 ,在 进行 实例 开发 的 时 候 应 当 注 意 任 务 划 分 的 合理 性 ,要 防 
止 死 锁 、 饥 饿 和 优先 级 翻转 ,要 考虑 代码 的 可 重 入 性 、 用 户 任 务 优先 级 以 及 访问 资源 的 方法 。 

在 进行 开发 前 ,首先 要 配置 环境 ,具体 包括 以 下 几 步 : 

(1) 配置 模板 联 编 文 件 。 在 创建 程序 之 前 ,配置 VxWorks 模板 联 编 文 件 tornado. tmf 
来 指定 使 用 VxWorks 的 环境 信息 ,指定 目标 及 目标 机 使 用 的 CPU 类 型 以 及 Tornado 目标 
服务 器 工作 所 需要 的 主机 名 。CPU 类 型 必须 与 VxWorks 中 BSP 板 级 支持 包 中 对 应 的 目 
标 类 型 一 致 。 同 时 ,还 需 确 定 程序 创建 过 程 中 所 用 到 的 Tornado 工具 的 位 置 , 包 括 编译 器 
和 目标 模板 等 工具 的 位 置 。 

(2) 创建 程序 。 生 成 Simulink 模块 ,创建 和 初始 化 Simulink 的 具体 内 容 , 初 始 化 的 内 
容 包 括 模拟 参数 的 设置 ,仿真 结构 的 配置 以 及 Tornado 的 配置 ,并 创建 应 用 程序 ,如 图 12. 15 
所 示 。 生 成 的 应 用 程序 的 目标 文件 的 扩展 名 为 . lo( 代 表 loadable object)。 初 始 化 成 功 后 ， 
在 模型 目录 下 将 生成 一 个 . lo 文件 。 


Create a bootable Yzgorks iaage 【cust0E configured)..- 加 四 
Project 

Hame: 
[EET 
Location: 


EC \Tornado? 2\target\proj \demo 车 | 


Project description (optional) 一 一 一 一 一 一 


Enter description here> 


Workspace 
© Add t 


人 Add to a New or Existing Work: 


C:\Tornado2. 2\target\proj \WorkspaceD. ws | 


图 12.15 创建 新 的 程序 


(3) 编写 源 代码 程序 。 利 用 Tornado 的 编译 工具 编写 源 代码 程序 ,如 图 12. 16 所 示 。 
(4) 下 载 并 交互 运行 。 在 开发 调试 阶段 后 ,选用 手动 下 载 模型 映像 进行 仿真 。 当 程序 
基本 确定 后 ,直接 编译 到 VxWorks 操作 系统 中 ,开机 上 电 直 接 运 行 。 
程序 的 运行 主要 包含 3 个 步 又: 
(1) 在 主机 和 目标 机 之 间 建 立 通信 连接 。 
(2) 将 目标 文件 从 主机 转移 到 目标 机 上 。 
(3) 运行 程序 , 即 可 获得 系统 仿真 结果 。 
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ado — C:\Tornado2. 2\target\proj\deno\priConfig.c 
File Edit Yiex Project Build Debug Tools Yindow Help 


Dlsle| ¥|le| Sl?lwllT 4 ot A del nl 
a 昌 | 本 地 EL 


usrWdbInit () 

Build Spec]default = usrWindvievInit (); 
usrShovInit (): 

} 


usrkernelCorelInit 一 core kernel facilities 


usrkernelCoreInit (void) 
的 ey 人 


Wind River Systens 


图 12.16 编写 源 代码 


本 章 小 结 


本 章 主要 介绍 了 和 能 人 式 操作 系统 的 管理 机 制 . 嵌 入 式 操 作 系统 的 集成 开发 环境 及 开发 
能 人 式 操作 系统 是 符 人 式 系统 的 基础 ,是 运行 在 嵌入 式 硬 件 平台 上 ,对 系统 软 硬 件 资源 
进行 统一 协调 控制 的 操作 系统 软件 。 肉 入 式 操作 系统 具有 高 实时 性 .可 裁剪 性 ,高 可 靠 性 、 
接口 统一 、 网 络 功能 强大 、 体 积 小 巧 .固化 代码 .操作 简单 易学 等 特点 ,是 各 类 典 入 式 操作 系 
统 开发 的 统一 无 关 性 平台 。 
能 入 式 操作 系统 采用 多 任务 机 制 ,根据 完 成 截止 时 间 的 不 同 , 实 时 任务 分 为 硬 实 时 任务 
和 软 实时 任务 。 任 务 采用 任务 控制 块 来 进行 管理 ,分 为 就 绪 、 执 行 和 等 待 3 个 状态 ,任务 要 
参与 资源 的 竞争 ,只 有 在 所 需 资源 得 到 满足 的 情况 下 才能 得 到 执行 。 通 过 任务 调度 ,能 使 就 
绪 态 的 任务 获得 CPU 来 执行 ,任务 调度 算法 一 般 有 基于 优先 级 的 抢占 式 调 度 算 法 和 时 间 
片 轮 转调 度 算 法 两 种 。 基 于 优先 级 的 抢占 式 调度 是 使 具有 最 高 优先 级 的 任务 先 执行 ,时 间 
片 轮转 调度 算法 主要 是 为 相同 优先 级 的 任务 调度 服务 ,多 数 实时 内 核 采 用 基于 优先 级 调度 
的 算法 ,但 有 些 实时 内 核 常常 会 实现 两 种 算法 混合 的 调度 方案 。 由 任务 调度 所 带 来 的 就 是 
各 个 任务 之 间 不 可 避免 的 相互 协同 关系 , 即 任务 间 通 信 。 一 般 散 入 式 操作 系统 提供 共享 内 
存 机 制 、 信 号 量 机 制 及 消息 队列 与 管道 3 种 任务 间 通 信 方 法 。 共 享 内 存 机 制 是 通过 访问 共 
同 的 内 存 空 间 实现 数据 之 间 的 相互 传递 ;信号 量 机 制 是 任务 间 少 量 信息 的 通信 、 提 供 同步 和 
互 斥 的 主要 手段 ;而 消息 队列 与 管道 是 实现 大 量 数据 传输 的 重要 手段 。 
嵌入 式 操作 系统 的 内 存 管 理 机 制 采用 动态 内 存 管 理 机 制 和 虚拟 内 存 管理 机 制 ,操作 系 
统 提 供 了 动态 内 存 分 配 接 口 来 完成 动态 内 存 管理 。 由 于 有 些 髋 入 式 系统 中 的 CPU 提供 
MMU,MMU 具备 内 存 地 址 映射 和 寻 址 功能 ,从 而 可 以 完成 从 虚拟 地 址 到 物理 地 址 的 转 
换 , 因 此 可 以 实现 虚拟 内 存 管理 机 制 ,这 样 , 既 可 十 分 有 效 地 提高 系统 可 靠 性 和 安全 性 ,又 可 
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满足 程序 的 运行 速度 需求 ,节约 物理 内 存 空 间 。 

I/O 设备 管理 及 文件 系统 也 是 嵌 人 式 操作 系统 的 重要 组 成 部 分 。 设 备 的 管理 分 为 缓冲 
技术 .设备 调度 和 设备 分 配 3 部 分 。 中 断 处理 是 设备 管理 中 至 关 重 要 的 组 成 部 分 ,中 断 是 导 
致 程序 正 常 执 行 流 程 发 生 改 变 的 事件 。 艇 入 式 操 作 系统 中 的 文件 管理 和 通用 的 操作 系统 中 
的 文件 管理 有 所 不 同 , 其 主要 提供 文件 存储 ,检索 和 更 新 等 功能 ,一 般 不 提供 保护 和 加 密 等 
安全 机 制 。 在 某 些 情况 下 ,文件 系统 还 可 以 针对 特殊 的 目的 来 进行 定制 。 

VxWorks 是 一 种 实时 多 任务 的 能 和 人 式 操作 系统 , 它 由 400 多 个 相对 独立 的 、 短 小 精炼 
的 目标 模块 组 成 ,用 户 可 根据 需要 选择 适当 模块 来 裁剪 和 配置 系统 ,系统 的 链接 器 也 可 按 应 
用 的 需要 自动 链接 一 些 目标 模块 。VxWorks 系统 被 广泛 地 应 用 与 通信 军事 .航空 ,航天 等 
高 精 尖 技术 及 实时 性 要 求 极 高 的 领域 中 ,并 已 成 为 租 入 式 系统 开发 中 的 主要 开发 环境 之 一 。 

随 着 娩 入 式 软件 的 发 展 ,组 入 式 操作 系统 的 开发 也 越 来 越 重要 。Tornado 集成 开发 环 
境 是 舱 入 式 软件 开发 中 一 种 重要 的 交叉 编译 和 调试 环境 , 它 以 VxWorks 为 底层 租 入 式 操 
作 系 统 ,可 以 实现 操作 系统 和 骨 入 式 软件 的 共同 开发 ,为 租 入 式 系统 开发 人 员 提 供 了 一 个 不 
受 目标 机 资源 限制 的 超级 开发 和 调试 环境 。 


习题 
12.1 和 能 人 式 操作 系统 的 特点 是 什么 ? 

12.2 艇 入 式 操作 系统 中 任务 的 状态 有 哪些 ”其 状态 之 间 是 如 何 转换 的 ? 
12.3 什么 叫 任务 切换 ? 任务 切换 的 主要 工作 是 什么 ? 

12.4 嵌入 式 操作 系统 中 如 何 实现 任务 间 通 信 ? 

12.5 购 入 式 操作 系统 中 的 内 存 管理 机 制 如 何 设置 ? 

12.6 插入 式 系统 中 的 中 断 的 分 类 有 哪些 ?中断 处 理 的 基本 过 程 如 何 ? 
12.7 嵌入 式 操 作 系 统 中 文件 .设备 和 设备 驱动 之 间 的 关系 如 何 ? 

12.8 一 般 和 入 式 系统 的 开发 流程 包括 哪些 步 又? 
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